40秒生成1080P视频,3.6元一条,字节这次又要掀桌子了?藏师傅Seedance 1.0 Pro实测
输入“/”快速插入内容
40秒生成1080P视频,3.6元一条,字节这次又要掀桌子了?藏师傅Seedance 1.0 Pro实测
用户4242
用户4242
2025年6月11日修改
朋友们好,我是歸藏(guizang)。
今天上午的火山引擎Force原动力大会上字节发布了 Seedance 1.0 Pro 视频生成模型。
也就是 即梦里面的视频3.0 pro 模型。
我也提前测试了一下,发现这次字节的视频模型真的站起来了。
在图生和文生的提示词理解、画面细节、物理表现一致性理解等方面都无可挑剔,非常强悍,而且还是原生 1080P 分辨率。
在 Artificial Analysis 上,Seedance 1.0 文生视频、图生视频的成绩都在第一,比 Veo 3 高了很多。
🎉
先介绍一下 Seedance 1.0 Pro 模型特色:
•
目前模型想支持文生视频、首帧图生视频,输出分辨率为 1080P,最长生成 10 秒
•
支持单次生成无缝切换的多镜头叙事视频,而且可以保持人物场景一致性
•
在多主体动作和复杂运镜提示词的表现上非常好
•
画面与主体动态效果更自然,结构性更好,崩坏率更低
•
生成速度超快,1080P 分辨率的 5 秒视频生成只需要 40 秒
•
价格有优势,在如此高质量的前提下, 通过火山引擎调用 Seedance 1.0 Pro 5 秒 1080P 视频 API 价格仅为 3.67 元
01 多镜头生成测试
先来看看字节的看家本事吧,哈哈。
Seedance 1.0 Pro 这次单次生成多镜头的能力更加稳定和可用。
下面这个图生视频 Seedance 1.0 Pro 对于提示词的理解都非常到位。
三段完全不同景别和运镜的分镜都完美实现了。
而且由于是图生很考验场景和人物一致性,人物的装束和这种酒店的设计风格三个分镜都很一致没啥问题。
图生视频|故事:紧急撤离 (The Extraction)
分镜一 (0-4秒): 一个身穿黑色战术装备、头戴红色镜面头盔的人,手持手枪,在酒店的走廊里高速奔跑。镜头以与他同样的速度进行横向跟拍,背景因运动而模糊,营造出紧张的急迫感。
分镜二 (4-7秒): 镜头切换到一个固定的机位,位于走廊拐角的一组电梯门前。奔跑者冲入画面,一个急刹停在电梯门前,他用空着的手反复、用力地按着下行按钮,同时身体紧绷,不时回头望向来时的走廊方向。
分镜三 (7-10秒): 切换到电梯内部的视角,从一个较低的角度向外拍摄。电梯门“叮”的一声打开,门外的奔跑者立刻冲了进来,与电梯里几位目瞪口呆的普通乘客擦肩而过。他一进入电梯就立刻转身面向门口,电梯门随即开始关闭,切断了外部的视野。
以往我们很少用文生,主要是视频生成成本高,崩坏概率大,文生不好控制。
但是随着像 Seedance 1.0 Pro 这样的提示词遵循非常好的模型不断出现,视频成本不断降低,文生在普通用户这里可能是主流。
下面这个一段提示词就搞定了一个餐饮宣传片的常见镜头,而且菜品的样式都能做到三个分镜是一样的。
文生视频|最后的点缀 (The Final Touch)
分镜一 (0-4秒): 在明亮的厨房里,一位穿着白色厨师服的厨师正低头审视着一个白色盘子里的菜肴。镜头为中景,展示了厨师的专注。