分享
AI视频爆发式更新- 近半年闭源产品趋势
输入“/”快速插入内容
AI视频爆发式更新- 近半年闭源产品趋势
飞书用户4392
2024年10月9日修改
本文作者Bay,写于24.09月底,关注公众号“Bay的设计奥德赛”接受及时推送
前言 - AI视频产品近半年发展
Sora之后,DiT架构成为视频生成产品的主流技术。这大半年里,横空出世的Luma AI、Kling成为视频生成领域最大黑马,而老牌选手Runway 也推出了实力强劲的Gen3模型。AI视频生成在画面表现力、语义理解、清晰度、可控性方面有了大幅提升,同时多家产品在音画同步、笔刷等工具上做了更新,提升了产品可控性。
这篇文章会带大家了解AI视频产品的最新能力,不同产品优势及展示各个产品实测效果。
这个系列预计分为闭源、开源两篇。以下是本文目录:
一.先说结论
头部产品能力测评
前两个场景制作于9月初,主要针对AI视频生成最火的Runway(Gen-3)、Luma AI(Dream Machine1.5)、可灵 1.0进行了测试。
txt2vid
测试了5个不同场景的表现,Runway、Luma 各有千秋,可灵1.0在清晰度、语义理解、画面绘制上还有较大提升空间。
img2vid
Runway在光影效果中表现得不够真实,但综合下来对各场景的支持度都比较高。
Kling 1.0综合表现依然很差,但在人物特写、光影上确实有着不俗的表现,Luma则在人物特写上显得非常弱势,处理抽象材质运动时表现不凡。
Kling1.0 vs 1.5
可灵 1.5与Luma 、Runway Gen-3 的差距肉眼可见地在缩小
(该案例测评于9月末)
。