Seedance 2.0 实战指南：高质量制作视频

starks_arq
发布于 10小时前
阅读 33

该指南详细介绍了 Seedance 2.0 视频生成 AI 的实战技巧，涵盖了通过 CapCut 访问的方法、五段式提示词构建框架、保持角色一致性的引用图策略，以及利用中文提示词优化物理细节的进阶技巧，旨在帮助用户将 AI 视频从简单生成转向专业化影视生产。

![Image](https://img.learnblockchain.cn/2026/03/29/21412139_image.jpg)

我们经营着一家 AI 电影工作室，曾为政府和价值数十亿美元的公司制作影片。在过去的几个月里，我们深入研究了 Seedance 2.0，测试了每一项技术并记录了实际有效的方法。这是一份免费的完整技术手册。

## 如何立即访问 Seedance 2.0

目前有两种方式可以访问。最直接的方法是：下载 **CapCut**（剪映国际版），将 VPN 设置为 **印度尼西亚**，即可在应用内获得 Seedance 2.0 的完整访问权限。无需排队，无需 API 申请，也无需特殊权限。

## 核心限制与创作逻辑

Seedance 生成的片段上限为 15 秒，分辨率为 720p。这是目前的上限，无法直接生成一分钟的视频或原生 4K 输出。

制作真实视频的核心在于“剪辑”。将一帧画面转化为 5 秒片段，另一帧转化为 10 秒，再一帧转化为 15 秒。通过拼接这些独立的镜头（5、10 或 15 秒），你可以构建出一个流畅的一分钟视频。专业剪辑师的工作方式也是如此。

**核心转变：** 不要想着“我要生成一个视频”，而要想着“我要生成一系列镜头”。一旦完成这个思维转变，Seedance 就会从一个玩具变成生产力工具。

## 优先拆解场景

在打开 CapCut 之前，先在纸上规划你的视频：
*   **场景 1：** 广角全景，5 秒。
*   **场景 2：** 特写反应，10 秒。
*   **场景 3：** 反打镜头，15 秒。

为每个场景编写具体笔记，包括设置、构图、动作、情绪和声音。一个一分钟的视频通常由 4 到 5 个场景组成。每个场景单独生成，最后在后期进行拼接。这种方法之所以有效，是因为 Seedance 在专注于单一镜头、单一动作和单一时刻时表现最强。

## 确定你的工作流

你需要决定是需要跨视频的**一致角色**，还是只需要一致的环境和风格？

### 1. 无需一致角色：全 Text-to-Video（文本转视频）
设定一个风格锚点，构建一个锁定视觉语言的基础 Prompt，然后逐场景生成。Seedance 会在同一次生成中处理音频和视频，因此请在 Prompt 中加入旁白、环境音和情绪描述。在每个 Prompt 中保持描述性语言的一致性，模型会从相同的视觉空间提取内容，使最终拼接的视频具有连贯性。

### 2. 需要一致角色（动画或插画）：Image-to-Video（图生视频）
先在 Nano Banana Pro 中构建分镜帧。每个场景一帧，确保构图和角色位置精确。NB Pro 在生成前会进行思考步骤并自我修正一致性，因此它比其他工具更能保持角色身份。然后将每一帧放入 Seedance 进行 Image-to-Video —— 图片承载身份，Prompt 添加动作。

## 五段式 Prompt 结构

大多数人写 Prompt 像写文章，模型会忽略其中 80% 的内容。每个 Seedance Prompt 应包含以下五个模块：

### 1. 主体（SUBJECT）
描述画面中的人物或物体、服装、设置、情绪。要具体且具有物理感。
> ```
> 一个穿着深色羊毛大衣的男人站在细雨蒙蒙的屋顶边缘，肩膀紧绷，下颌微调，背景是零散的城市灯光。
> ```

### 2. 动作（ACTION）
使用单一动词，单一动作。
> ```
> 他慢慢转身面对镜头。
> ```
> **注意：** 不要使用多个动词（如“他转身，向前走，伸手并说话”），这会干扰模型。

### 3. 镜头（CAMERA）
描述构图、运动和镜头感。
*   **运动关键词：** “slow dolly push-in”（慢速推镜头）、“lateral tracking shot”（横向追踪）、“static locked-off frame”（固定镜头）、“slow pan left”（向左慢摇）、“orbital movement”（环绕运动）。
*   **速度修饰词：** **slowly** 与 **rapidly** 会产生截然不同的效果。
*   **构图关键词：** “extreme close-up”（特写）、“medium shot waist up”（中景）、“wide establishing”（远景全貌）、“over-the-shoulder”（过肩镜头）、“low angle”（低角度仰拍）。

### 4. 风格（STYLE）
一个审美锚点加上光影和色彩。避免只使用 “cinematic” 这种泛化的词。
*   **强化组合：** “Motivated warm lighting, natural film grain, shallow depth of field, lifted blacks”（有理据的暖色调照明、自然胶片颗粒、浅景深、提升黑色部分）。
*   **胶片锚点：** “Kodak Vision3 500T”（暖色调电影感）、“ARRI Alexa color science”（高端数字感）、“35mm film grain”（独立电影质感）。
*   **光影关键词：** “Motivated lighting”（最强的电影感指令）、“Practical light sources visible in frame”（增加真实感）、“Volumetric dust particles”（增加大气深度）。

### 5. 质量后缀（QUALITY SUFFIX）
每个 Prompt 都必须包含：
> ```
> 4K, Ultra HD, Rich details, Sharp clarity, Cinematic texture, Natural colors, Stable picture.
> ```

## Prompt 长度建议

*   **Text-to-Video：** 120 到 280 个单词。低于 30 个词模型会随机发挥，超过 280 个词模型会开始丢失指令。
*   **Image-to-Video：** 最多 50 到 80 个单词。因为参考图已经承载了身份信息，过长的 Prompt 会削弱图片建立的特征。模型会在文本和图像之间分配注意力，长文本会覆盖视觉参考，导致角色走样。
*   **禁用负面提示词：** Seedance 不支持负面提示词。请使用正面表述，例如用 “Stable picture, sharp clarity” 代替 “no blur, no shaking”。

## 参考图系统

Seedance 支持多达 12 个参考文件（9 张图片、3 个视频、3 个音频）。
*   **权重分配：** `[@Image1]` 获得的注意力权重比其他位置高出 40% 到 50%。最重要的参考图务必放在第一个位置。
*   **角色一致性：** 每个角色准备三张图（正面、四分之三侧面、正侧面），这可以达到 75% 到 85% 的身份一致性。
*   **切图建议：** 使用单独的面部裁剪图，不要使用网格拼图（Turnaround grids），否则模型会产生混淆。
*   **Image-to-Video 技巧：** Prompt 开头使用：
> ```
> [@Image1] as the first frame
> ```
> 不要在文本中重复描述角色特征，只描述动作和环境。
*   **身份锁定短语：**
> ```
> Same person as [@Image1]. Do not alter facial proportions, eye shape, or hairstyle.
> ```

## 中文 Prompt 技巧

Seedance 由字节跳动开发，在中文数据上进行了大量训练。模型的 Token 分布偏向普通话，这意味着某些视觉概念（如空间关系、织物纹理、天气描述和建筑细节）在中文下的解析比英文更精准。

**实践建议：** 先用五段式结构写英文 Prompt，然后翻译成中文，两个版本都运行一下。在处理复杂的物理描述（如风吹动织物、雨打在石头上、光线穿过玻璃）时，中文 Prompt 往往能锁定英文版显得模糊的细节。

## 病毒式内容策略

Seedance 的生成速度足以追赶实时热点。
1.  **监控趋势：** 关注社交媒体或预测市场的热点话题。
2.  **快速反应：** 在话题爆发的几小时内，利用 Seedance 生成 4 到 5 个场景，拼接成 30 到 50 秒的视频并发布。
3.  **算法优势：** 当大众对某个新话题有海量需求而视频供应不足时，算法会大力推送高质量的 AI 视频。

## 生成写实人物

上述所有方法在印尼 VPN 环境下的 CapCut 中都适用，包括动画角色、插画风格和环境生成。但需要注意的是，CapCut 内部有时会对极致写实的人像生成进行限制。要生成高度一致且写实的真人角色，需要配合特定的起始帧生成和 Prompt 锁定技术，确保角色在不同镜头间不走样。

>- 原文链接： [x.com/starks_arq/status/...](https://x.com/starks_arq/status/2037928570257903983)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

如何立即访问 Seedance 2.0

目前有两种方式可以访问。最直接的方法是：下载 CapCut（剪映国际版），将 VPN 设置为 印度尼西亚，即可在应用内获得 Seedance 2.0 的完整访问权限。无需排队，无需 API 申请，也无需特殊权限。

核心限制与创作逻辑

Seedance 生成的片段上限为 15 秒，分辨率为 720p。这是目前的上限，无法直接生成一分钟的视频或原生 4K 输出。

核心转变： 不要想着“我要生成一个视频”，而要想着“我要生成一系列镜头”。一旦完成这个思维转变，Seedance 就会从一个玩具变成生产力工具。

优先拆解场景

在打开 CapCut 之前，先在纸上规划你的视频：

场景 1： 广角全景，5 秒。
场景 2： 特写反应，10 秒。
场景 3： 反打镜头，15 秒。

确定你的工作流

你需要决定是需要跨视频的一致角色，还是只需要一致的环境和风格？

1. 无需一致角色：全 Text-to-Video（文本转视频）

设定一个风格锚点，构建一个锁定视觉语言的基础 Prompt，然后逐场景生成。Seedance 会在同一次生成中处理音频和视频，因此请在 Prompt 中加入旁白、环境音和情绪描述。在每个 Prompt 中保持描述性语言的一致性，模型会从相同的视觉空间提取内容，使最终拼接的视频具有连贯性。

2. 需要一致角色（动画或插画）：Image-to-Video（图生视频）

先在 Nano Banana Pro 中构建分镜帧。每个场景一帧，确保构图和角色位置精确。NB Pro 在生成前会进行思考步骤并自我修正一致性，因此它比其他工具更能保持角色身份。然后将每一帧放入 Seedance 进行 Image-to-Video —— 图片承载身份，Prompt 添加动作。

五段式 Prompt 结构

大多数人写 Prompt 像写文章，模型会忽略其中 80% 的内容。每个 Seedance Prompt 应包含以下五个模块：

1. 主体（SUBJECT）

描述画面中的人物或物体、服装、设置、情绪。要具体且具有物理感。

一个穿着深色羊毛大衣的男人站在细雨蒙蒙的屋顶边缘，肩膀紧绷，下颌微调，背景是零散的城市灯光。

2. 动作（ACTION）

使用单一动词，单一动作。

他慢慢转身面对镜头。
注意： 不要使用多个动词（如“他转身，向前走，伸手并说话”），这会干扰模型。

3. 镜头（CAMERA）

描述构图、运动和镜头感。

运动关键词： “slow dolly push-in”（慢速推镜头）、“lateral tracking shot”（横向追踪）、“static locked-off frame”（固定镜头）、“slow pan left”（向左慢摇）、“orbital movement”（环绕运动）。
速度修饰词： slowly 与 rapidly 会产生截然不同的效果。
构图关键词： “extreme close-up”（特写）、“medium shot waist up”（中景）、“wide establishing”（远景全貌）、“over-the-shoulder”（过肩镜头）、“low angle”（低角度仰拍）。

4. 风格（STYLE）

一个审美锚点加上光影和色彩。避免只使用 “cinematic” 这种泛化的词。

强化组合： “Motivated warm lighting, natural film grain, shallow depth of field, lifted blacks”（有理据的暖色调照明、自然胶片颗粒、浅景深、提升黑色部分）。
胶片锚点： “Kodak Vision3 500T”（暖色调电影感）、“ARRI Alexa color science”（高端数字感）、“35mm film grain”（独立电影质感）。
光影关键词： “Motivated lighting”（最强的电影感指令）、“Practical light sources visible in frame”（增加真实感）、“Volumetric dust particles”（增加大气深度）。

5. 质量后缀（QUALITY SUFFIX）

每个 Prompt 都必须包含：

4K, Ultra HD, Rich details, Sharp clarity, Cinematic texture, Natural colors, Stable picture.

Prompt 长度建议

Text-to-Video： 120 到 280 个单词。低于 30 个词模型会随机发挥，超过 280 个词模型会开始丢失指令。
Image-to-Video： 最多 50 到 80 个单词。因为参考图已经承载了身份信息，过长的 Prompt 会削弱图片建立的特征。模型会在文本和图像之间分配注意力，长文本会覆盖视觉参考，导致角色走样。
禁用负面提示词： Seedance 不支持负面提示词。请使用正面表述，例如用 “Stable picture, sharp clarity” 代替 “no blur, no shaking”。

参考图系统

Seedance 支持多达 12 个参考文件（9 张图片、3 个视频、3 个音频）。

权重分配： [@Image1] 获得的注意力权重比其他位置高出 40% 到 50%。最重要的参考图务必放在第一个位置。
角色一致性： 每个角色准备三张图（正面、四分之三侧面、正侧面），这可以达到 75% 到 85% 的身份一致性。
切图建议： 使用单独的面部裁剪图，不要使用网格拼图（Turnaround grids），否则模型会产生混淆。
Image-to-Video 技巧： Prompt 开头使用：
```
[@Image1] as the first frame
```
不要在文本中重复描述角色特征，只描述动作和环境。

身份锁定短语：

Same person as [@Image1]. Do not alter facial proportions, eye shape, or hairstyle.

中文 Prompt 技巧

实践建议： 先用五段式结构写英文 Prompt，然后翻译成中文，两个版本都运行一下。在处理复杂的物理描述（如风吹动织物、雨打在石头上、光线穿过玻璃）时，中文 Prompt 往往能锁定英文版显得模糊的细节。

病毒式内容策略

Seedance 的生成速度足以追赶实时热点。

监控趋势： 关注社交媒体或预测市场的热点话题。
快速反应： 在话题爆发的几小时内，利用 Seedance 生成 4 到 5 个场景，拼接成 30 到 50 秒的视频并发布。
算法优势： 当大众对某个新话题有海量需求而视频供应不足时，算法会大力推送高质量的 AI 视频。

生成写实人物

原文链接： x.com/starks_arq/status/...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

翻译
学分: 0
分类: AI
标签: Seedance 2.0 AI视频生成提示词工程角色一致性图生视频字节跳动

本文参与登链社区写作激励计划，好文好收益，欢迎正在阅读的你也加入。

Seedance 2.0 实战指南：高质量制作视频

如何立即访问 Seedance 2.0

核心限制与创作逻辑

优先拆解场景

确定你的工作流

1. 无需一致角色：全 Text-to-Video（文本转视频）

2. 需要一致角色（动画或插画）：Image-to-Video（图生视频）

五段式 Prompt 结构

1. 主体（SUBJECT）

2. 动作（ACTION）

3. 镜头（CAMERA）

4. 风格（STYLE）

5. 质量后缀（QUALITY SUFFIX）

Prompt 长度建议

参考图系统

中文 Prompt 技巧

病毒式内容策略

生成写实人物

0 条评论

文章目录

Seedance 2.0 实战指南： 高质量制作视频

如何立即访问 Seedance 2.0

核心限制与创作逻辑

优先拆解场景

确定你的工作流

1. 无需一致角色：全 Text-to-Video（文本转视频）

2. 需要一致角色（动画或插画）：Image-to-Video（图生视频）

五段式 Prompt 结构

1. 主体（SUBJECT）

2. 动作（ACTION）

3. 镜头（CAMERA）

4. 风格（STYLE）

5. 质量后缀（QUALITY SUFFIX）

Prompt 长度建议

参考图系统

中文 Prompt 技巧

病毒式内容策略

生成写实人物

0 条评论

文章目录

Seedance 2.0 实战指南：高质量制作视频