快手于2025年12月22日前后为其视频生成大模型可灵(Kling)发布了2.6版本更新,核心突破在于引入了行业领先的原生“语音控制”与音频同步技术。不同于以往视频与音频分离生成的模式,Kling 2.6实现了音视频的一次性同步生成,特别新增了高保真的AI唱歌(Singing)和说唱(Rapping)功能。该更新使得生成的视频角色能够根据音频节奏进行精准的口型同步、面部表情变化以及肢体动作配合。此外,用户可以上传自己的声音样本训练专属语音模型,确保了跨片段的角色声音一致性。这一进步极大地提升了AI视频在短视频、广告营销和音乐娱乐领域的实用性,标志着生成式AI步入全模态实时创作的新阶段。