DAILY LESSON / 2026-02-08

字节Seedance 2.0：视频生成进入四模态时代

字节跳动的Seedance 2.0来了。你现在就可以去即梦App上体验，春节前估计能在豆包上全量开放。

AI视频字节跳动即梦豆包AI模型自媒体电商干货

你好，我是C哥。

字节跳动的Seedance 2.0来了。你现在就可以去即梦App上体验，春节前估计能在豆包上全量开放。

这不是简单的版本更新，而是视频生成玩法的彻底改变。以前做视频，要么写提示词，要么垫张图。Seedance 2.0支持文字、图片、视频、音频四种输入。

这意味着什么？

你可以用一张图片定义视觉风格，用一段视频指定角色动作，用一段音频驱动节奏，再用文字描述具体场景。它能听懂你的意图：图片是管长相的，视频是管动作的。这解决了AI视频最大的痛点，就是角色一致性。以前生成的每一帧可能人都不一样，现在有了参考系统，角色就能保持稳定。

技术上，它采用了双分支扩散Transformer架构。简单说，视频和音频是在同一个模型里生成的，而不是先生成视频再配音。所以唇形同步达到了音素级精度，连脚步声、引擎声这些环境音效都能和画面完美卡点。

相关推荐