Seedance 2.0 实战指南: 高质量制作视频

该指南详细介绍了 Seedance 2.0 视频生成 AI 的实战技巧,涵盖了通过 CapCut 访问的方法、五段式提示词构建框架、保持角色一致性的引用图策略,以及利用中文提示词优化物理细节的进阶技巧,旨在帮助用户将 AI 视频从简单生成转向专业化影视生产。

Image

我们经营着一家 AI 电影工作室,曾为政府和价值数十亿美元的公司制作影片。在过去的几个月里,我们深入研究了 Seedance 2.0,测试了每一项技术并记录了实际有效的方法。这是一份免费的完整技术手册。

如何立即访问 Seedance 2.0

目前有两种方式可以访问。最直接的方法是:下载 CapCut(剪映国际版),将 VPN 设置为 印度尼西亚,即可在应用内获得 Seedance 2.0 的完整访问权限。无需排队,无需 API 申请,也无需特殊权限。

核心限制与创作逻辑

Seedance 生成的片段上限为 15 秒,分辨率为 720p。这是目前的上限,无法直接生成一分钟的视频或原生 4K 输出。

制作真实视频的核心在于“剪辑”。将一帧画面转化为 5 秒片段,另一帧转化为 10 秒,再一帧转化为 15 秒。通过拼接这些独立的镜头(5、10 或 15 秒),你可以构建出一个流畅的一分钟视频。专业剪辑师的工作方式也是如此。

核心转变: 不要想着“我要生成一个视频”,而要想着“我要生成一系列镜头”。一旦完成这个思维转变,Seedance 就会从一个玩具变成生产力工具。

优先拆解场景

在打开 CapCut 之前,先在纸上规划你的视频:

  • 场景 1: 广角全景,5 秒。
  • 场景 2: 特写反应,10 秒。
  • 场景 3: 反打镜头,15 秒。

为每个场景编写具体笔记,包括设置、构图、动作、情绪和声音。一个一分钟的视频通常由 4 到 5 个场景组成。每个场景单独生成,最后在后期进行拼接。这种方法之所以有效,是因为 Seedance 在专注于单一镜头、单一动作和单一时刻时表现最强。

确定你的工作流

你需要决定是需要跨视频的一致角色,还是只需要一致的环境和风格?

1. 无需一致角色:全 Text-to-Video(文本转视频)

设定一个风格锚点,构建一个锁定视觉语言的基础 Prompt,然后逐场景生成。Seedance 会在同一次生成中处理音频和视频,因此请在 Prompt 中加入旁白、环境音和情绪描述。在每个 Prompt 中保持描述性语言的一致性,模型会从相同的视觉空间提取内容,使最终拼接的视频具有连贯性。

2. 需要一致角色(动画或插画):Image-to-Video(图生视频)

先在 Nano Banana Pro 中构建分镜帧。每个场景一帧,确保构图和角色位置精确。NB Pro 在生成前会进行思考步骤并自我修正一致性,因此它比其他工具更能保持角色身份。然后将每一帧放入 Seedance 进行 Image-to-Video —— 图片承载身份,Prompt 添加动作。

五段式 Prompt 结构

大多数人写 Prompt 像写文章,模型会忽略其中 80% 的内容。每个 Seedance Prompt 应包含以下五个模块:

1. 主体(SUBJECT)

描述画面中的人物或物体、服装、设置、情绪。要具体且具有物理感。

一个穿着深色羊毛大衣的男人站在细雨蒙蒙的屋顶边缘,肩膀紧绷,下颌微调,背景是零散的城市灯光。

2. 动作(ACTION)

使用单一动词,单一动作。

他慢慢转身面对镜头。

注意: 不要使用多个动词(如“他转身,向前走,伸手并说话”),这会干扰模型。

3. 镜头(CAMERA)

描述构图、运动和镜头感。

  • 运动关键词: “slow dolly push-in”(慢速推镜头)、“lateral tracking shot”(横向追踪)、“static locked-off frame”(固定镜头)、“slow pan left”(向左慢摇)、“orbital movement”(环绕运动)。
  • 速度修饰词: slowlyrapidly 会产生截然不同的效果。
  • 构图关键词: “extreme close-up”(特写)、“medium shot waist up”(中景)、“wide establishing”(远景全貌)、“over-the-shoulder”(过肩镜头)、“low angle”(低角度仰拍)。

4. 风格(STYLE)

一个审美锚点加上光影和色彩。避免只使用 “cinematic” 这种泛化的词。

  • 强化组合: “Motivated warm lighting, natural film grain, shallow depth of field, lifted blacks”(有理据的暖色调照明、自然胶片颗粒、浅景深、提升黑色部分)。
  • 胶片锚点: “Kodak Vision3 500T”(暖色调电影感)、“ARRI Alexa color science”(高端数字感)、“35mm film grain”(独立电影质感)。
  • 光影关键词: “Motivated lighting”(最强的电影感指令)、“Practical light sources visible in frame”(增加真实感)、“Volumetric dust particles”(增加大气深度)。

5. 质量后缀(QUALITY SUFFIX)

每个 Prompt 都必须包含:

4K, Ultra HD, Rich details, Sharp clarity, Cinematic texture, Natural colors, Stable picture.

Prompt 长度建议

  • Text-to-Video: 120 到 280 个单词。低于 30 个词模型会随机发挥,超过 280 个词模型会开始丢失指令。
  • Image-to-Video: 最多 50 到 80 个单词。因为参考图已经承载了身份信息,过长的 Prompt 会削弱图片建立的特征。模型会在文本和图像之间分配注意力,长文本会覆盖视觉参考,导致角色走样。
  • 禁用负面提示词: Seedance 不支持负面提示词。请使用正面表述,例如用 “Stable picture, sharp clarity” 代替 “no blur, no shaking”。

参考图系统

Seedance 支持多达 12 个参考文件(9 张图片、3 个视频、3 个音频)。

  • 权重分配: [@Image1] 获得的注意力权重比其他位置高出 40% 到 50%。最重要的参考图务必放在第一个位置。
  • 角色一致性: 每个角色准备三张图(正面、四分之三侧面、正侧面),这可以达到 75% 到 85% 的身份一致性。
  • 切图建议: 使用单独的面部裁剪图,不要使用网格拼图(Turnaround grids),否则模型会产生混淆。
  • Image-to-Video 技巧: Prompt 开头使用:
    [@Image1] as the first frame

    不要在文本中重复描述角色特征,只描述动作和环境。

  • 身份锁定短语:
    Same person as [@Image1]. Do not alter facial proportions, eye shape, or hairstyle.

中文 Prompt 技巧

Seedance 由字节跳动开发,在中文数据上进行了大量训练。模型的 Token 分布偏向普通话,这意味着某些视觉概念(如空间关系、织物纹理、天气描述和建筑细节)在中文下的解析比英文更精准。

实践建议: 先用五段式结构写英文 Prompt,然后翻译成中文,两个版本都运行一下。在处理复杂的物理描述(如风吹动织物、雨打在石头上、光线穿过玻璃)时,中文 Prompt 往往能锁定英文版显得模糊的细节。

病毒式内容策略

Seedance 的生成速度足以追赶实时热点。

  1. 监控趋势: 关注社交媒体或预测市场的热点话题。
  2. 快速反应: 在话题爆发的几小时内,利用 Seedance 生成 4 到 5 个场景,拼接成 30 到 50 秒的视频并发布。
  3. 算法优势: 当大众对某个新话题有海量需求而视频供应不足时,算法会大力推送高质量的 AI 视频。

生成写实人物

上述所有方法在印尼 VPN 环境下的 CapCut 中都适用,包括动画角色、插画风格和环境生成。但需要注意的是,CapCut 内部有时会对极致写实的人像生成进行限制。要生成高度一致且写实的真人角色,需要配合特定的起始帧生成和 Prompt 锁定技术,确保角色在不同镜头间不走样。

  • 原文链接: x.com/starks_arq/status/...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
starks_arq
starks_arq
江湖只有他的大名,没有他的介绍。