分享
坐稳一致性之王,生数科技再度发力,ViduQ1参考生图发布!
输入“/”快速插入内容
坐稳一致性之王,生数科技再度发力,ViduQ1参考生图发布!
用户4242
用户4242
2025年9月9日修改
继面向企业推出Q1参考生图商用解决方案后,9月9日,生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。
此次Vidu Q1参考生图功能的推出,旨在助力行业突破多主体一致性技术难题,推动Vidu升级为真正的“商业化生产主力”,实现从AI图像生成到视频生成的完整商业生产链闭环,引领AI多模态创作进入“生产级应用”新纪元。
Vidu Q1参考生图
以“参考够多,还原够真”
为核心,主要包括五大亮点:
1.
参考数量行业领先
同时支持7张参考图输入,可控性强。
2.
主体一致性更强
在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。
3.
高还原度,真实感更强
在保持参考图特征的同时,还原度高,更贴近用户原始输入,真正做到“所见即所得”。
4.
创作自由度极高
一张图 + 一句提示词,就能自由换装、换背景、自由合成。
支持多人同场景
,满足复杂剧情、合影、多角色电商等场景。
5.
支持1080P高清分辨率,中文语义理解更强,审美更适合本地
多图参考时代来临:Vidu Q1突破7张输入上限
“参考够多,才能还原够真”。输入的参考图数量“多”的意义在于,多主体、多道具始终保持一致,灵活适配多类型场景需求,画面更加丰富。这背后是Vidu Q1 大模型底座对于一致性、真实性、物理理解能力等维度的大幅提升,也是
AI生图从获取灵感创意的抽盲盒游戏迈向真正“指哪打哪”“所见即所得”的关键一步。
从单图参考到多图参考,是AI生图在一致性上的不断突破,可以说没有一致性,就没有大规模商业化应用。不同于单图参考的单一限定条件,Vidu Q1参考生图可以指定人物、场景、道具进行自由创作,通过多个参考对象实现对画面的更强可控,即使是复杂场景也能轻松拿捏。
举例来说,让小李子坐在霍格沃茨学院的教室里练习魔法。输入的多张参考图中包含了人物、道具、服饰、配饰等多个主体,场景非常复杂。从输出的结果来看,Vidu Q1参考生图严格遵循提示词,人物发型、五官均保持与原图一致,就连书本中的插图细节也被精准还原,每个物品位置摆放正确,且比例合理。左侧亮起的台灯灯光照亮了小李子侧脸和桌面上摊开的书本,宠物海德薇站在红色行李箱上毫无违和感,多个主体的融合高度一致。
案例1:
输入图:
prompt:在一个霍格沃茨的教室里,桌上摆放着一本打开的魔法书、一杯金色的带徽章的杯子里(里面是黄油啤酒)和一个蛇形魔法台灯,桌旁的红色行李箱上停着一只雪白的猫头鹰。[@图1]中的小李子身穿格兰芬多长袍和红黄条纹领带,戴着圆框眼镜,一只手拿一个接骨木杖,另一只手在空中施展魔法,正准备开始一段奇幻的魔法冒险。全景图。
输出结果: