坐稳一致性之王，生数科技再度发力，ViduQ1参考生图发布！

用户4242

2025年9月9日修改

继面向企业推出Q1参考生图商用解决方案后，9月9日，生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。​

此次Vidu Q1参考生图功能的推出，旨在助力行业突破多主体一致性技术难题，推动Vidu升级为真正的“商业化生产主力”，实现从AI图像生成到视频生成的完整商业生产链闭环，引领AI多模态创作进入“生产级应用”新纪元。​

Vidu  Q1参考生图以“参考够多，还原够真”为核心，主要包括五大亮点：​

1.
参考数量行业领先​

同时支持7张参考图输入，可控性强。

2.
主体一致性更强​

在多人、多场景、多次生成下，依旧保证人物/主体的面貌与特征不跑偏。​

3.
高还原度，真实感更强​

在保持参考图特征的同时，还原度高，更贴近用户原始输入，真正做到“所见即所得”。​

4.
创作自由度极高​

一张图 + 一句提示词，就能自由换装、换背景、自由合成。支持多人同场景，满足复杂剧情、合影、多角色电商等场景。​

5.
支持1080P高清分辨率，中文语义理解更强，审美更适合本地​

多图参考时代来临：Vidu Q1突破7张输入上限

“参考够多，才能还原够真”。输入的参考图数量“多”的意义在于，多主体、多道具始终保持一致，灵活适配多类型场景需求，画面更加丰富。这背后是Vidu Q1 大模型底座对于一致性、真实性、物理理解能力等维度的大幅提升，也是AI生图从获取灵感创意的抽盲盒游戏迈向真正“指哪打哪”“所见即所得”的关键一步。​

从单图参考到多图参考，是AI生图在一致性上的不断突破，可以说没有一致性，就没有大规模商业化应用。不同于单图参考的单一限定条件，Vidu Q1参考生图可以指定人物、场景、道具进行自由创作，通过多个参考对象实现对画面的更强可控，即使是复杂场景也能轻松拿捏。​

举例来说，让小李子坐在霍格沃茨学院的教室里练习魔法。输入的多张参考图中包含了人物、道具、服饰、配饰等多个主体，场景非常复杂。从输出的结果来看，Vidu Q1参考生图严格遵循提示词，人物发型、五官均保持与原图一致，就连书本中的插图细节也被精准还原，每个物品位置摆放正确，且比例合理。左侧亮起的台灯灯光照亮了小李子侧脸和桌面上摊开的书本，宠物海德薇站在红色行李箱上毫无违和感，多个主体的融合高度一致。​

案例1：

输入图：

common.docs_name - LarkCCM_Docs_Menu_Image

prompt：在一个霍格沃茨的教室里，桌上摆放着一本打开的魔法书、一杯金色的带徽章的杯子里（里面是黄油啤酒）和一个蛇形魔法台灯，桌旁的红色行李箱上停着一只雪白的猫头鹰。[@图1]中的小李子身穿格兰芬多长袍和红黄条纹领带，戴着圆框眼镜，一只手拿一个接骨木杖，另一只手在空中施展魔法，正准备开始一段奇幻的魔法冒险。全景图。​

输出结果：

坐稳一致性之王，生数科技再度发力，ViduQ1参考生图发布！​

坐稳一致性之王，生数科技再度发力，ViduQ1参考生图发布！