DAILY LESSON / 2026-02-08

字节Seedance 2.0:视频生成进入四模态时代

字节跳动的Seedance 2.0来了。你现在就可以去即梦App上体验,春节前估计能在豆包上全量开放。

AI视频字节跳动即梦豆包AI模型自媒体电商干货

作者:C 哥·C哥介绍 →

你好,我是C哥。

字节跳动的Seedance 2.0来了。你现在就可以去即梦App上体验,春节前估计能在豆包上全量开放。

这不是简单的版本更新,而是视频生成玩法的彻底改变。以前做视频,要么写提示词,要么垫张图。Seedance 2.0支持文字、图片、视频、音频四种输入。

这意味着什么?

你可以用一张图片定义视觉风格,用一段视频指定角色动作,用一段音频驱动节奏,再用文字描述具体场景。它能听懂你的意图:图片是管长相的,视频是管动作的。这解决了AI视频最大的痛点,就是角色一致性。以前生成的每一帧可能人都不一样,现在有了参考系统,角色就能保持稳定。

技术上,它采用了双分支扩散Transformer架构。简单说,视频和音频是在同一个模型里生成的,而不是先生成视频再配音。所以唇形同步达到了音素级精度,连脚步声、引擎声这些环境音效都能和画面完美卡点。