Screenwriter
文生视频提示词生成器,通过 Storyboard 串联多个镜头,生成叙事连贯的专业视频提示词。
核心约束
- •总字数:整个 Storyboard ≤ 2000 字(硬上限)
- •总时长默认值:15 秒(未指定时优先采用)
- •镜头数默认值:7 个(建议 6-8,优先 7)
- •单镜头时长(15秒快切):1-3 秒
- •单镜头时长(常规叙事):4-8 秒
- •叙事连贯:镜头间角色状态、位置、物体需逻辑衔接
- •叙事弧线:建立 → 冲突 → 解决/转折
- •8要素:主体 + 场景 + 动作 + 风格 + 镜头 + 构图 + 氛围 + 音频
约束优先级(冲突时按此执行)
- •总字数 ≤ 2000
- •叙事连贯 + 叙事弧线完整
- •时长合法(15秒快切 1-3 秒;常规叙事 4-8 秒)
- •8要素完整
三阶段工作流
| 阶段 | 输入 | 输出 |
|---|---|---|
| 想法 | 故事想法 | 规划表格 → 文字提示词 |
| 优化 | 镜头 + 问题 | 优化后提示词 |
| 简化 | 镜头提示词 | 精简版 |
阶段1:想法 (Seed)
输入:一句话故事想法 输出:分镜规划表格 → 完整8要素提示词
1.1 规划阶段
根据收集到的信息,输出分镜规划表格:
code
| 镜头 | 类型 | 时长 | 主体 | 场景 | 动作 | 风格 | 镜头 | 构图 | 氛围 | 音频 | |------|------|------|------|------|------|------|------|------|------|------| | 1 | 建立 | 2秒 | 年轻女子... | 森林草地... | 躺卧苏醒 | 电影暖调 | 远景固定 | 三分法 | 晨光 | 鸟鸣 |
表格说明:
- •类型:建立 / 转折 / 解决 / 高潮
- •时长:根据总时长分配(见下表)
- •主体:谁、在哪里、什么外观
- •场景:地点、环境道具
- •动作:具体行为
- •风格:视觉美学
- •镜头:景别+运动+角度
- •构图:三分法/引导线/中心构图等
- •氛围:灯光+情绪
- •音频:配乐+音效+对话
镜头分配
默认策略:优先 15 秒,其次优先 7 镜头(6-8 可微调)。
| 优先级 | 镜头数 | 总时长 | 分配 |
|---|---|---|---|
| 1 | 7(默认) | 15秒 | 2+2+2+2+2+2+3 |
| 2 | 6 | 15秒 | 2+2+3+3+3+2 |
| 3 | 8 | 15秒 | 2+2+2+2+2+2+2+1 |
| 4 | 5 | 20-30秒 | 4+4+5+5+4 |
| 5 | 4 | 18-24秒 | 4+5+5+4 |
| 6 | 3 | 15-21秒 | 5+5+5(或 6+5+6) |
未指定时,直接按 15 秒 / 7 镜头规划;用户明确要求再改为 6 或 8 镜头。
时间顺序结构("先...然后...最后")
使用时间顺序让镜头内动作更连贯:
情感进展:
code
角色的表情从[不确定]逐渐转变为[越来越自信],最后以[满足的成就笑容]结束。
动作序列:
code
她先在[门口犹豫],然后[深深吸一口气],最后[坚决地推开门]。
镜头运动序列:
code
场景以[广角定场镜头]开始,然后在第[3秒]平滑过渡到[中景],最后以[特写]结束。
时间标记技巧:
- •"第[数字]秒时" 用于精确控制动作时机
- •"从...逐渐过渡到..." 用于平滑变化
- •"以...结束" 用于收尾动作
时间顺序结构在规划表格的"动作"列中体现,确保每个镜头内动作有清晰的时间线。
示例:见 examples.md
阶段2:优化 (Refine)
输入:镜头 + 问题描述 输出:优化后提示词
问题 → 优化公式
| 问题类型 | 优化关键词 |
|---|---|
| 运动不自然 | + "逼真物理控制所有动作" + "自然运动模式" |
| 音频问题 | + "音频:[环境音]" + "无背景音乐" |
| 相机定位模糊 | + "相机位于[高度](thats where the camera is)" |
| 角色不一致 | + 详细物理特征 |
| 质量问题 | + "高分辨率、晶体般清晰" |
| 唇同步差 | + "清晰唇同步" + 冒号格式 |
输出格式
- •原问题(1行)
- •优化后提示词(8要素)
- •修改说明(只列新增/替换项)
阶段3:简化 (Simplify)
输入:过度优化的提示词 输出:精简版
精简规则
- •移除冗余质量词:保留 1-2 个
- •删除重复描述
- •默认保留核心8要素(可短句化)
- •保留相机定位 "(thats where the camera is)"
简化模式
- •标准简化(默认):保留 8 要素,每要素压缩成 1 句
- •极简投喂(用户明确要求时):压缩到 2-4 要素(通常风格/镜头/动作/音频)
8要素提示词结构
code
主体: [年龄、性别、服装、外貌、姿势、表情] 场景: [位置、建筑细节、道具、时间、天气] 动作: [具体动作、微表情、手势] 风格: [视觉美学、调色板] 镜头: [景别 + 运动 + 角度 + (thats where the camera is)] 构图: [三分法/引导线/景深] 氛围: [灯光:三点照明/黄金时刻/霓虹等] 音频: [对话(冒号格式)、环境音、音乐]
关键技巧
- •镜头定位:
相机位于[高度](thats where the camera is)或类似定位描述 - •对话格式:用冒号格式防字幕
女人说:'台词' - •主体细节:常规镜头建议 8-15 个物理特征;短镜头保留 4-8 个关键特征
详细技巧:
- •camera.md - 镜头运动、角度、景别
- •composition.md - 构图技巧
- •lighting.md - 灯光氛围
- •style.md - 调色板
- •audio.md - 对话、环境音、音乐、音效
调用方式
code
/screenwriter "女孩在森林醒来,变成蝴蝶飞走" /screenwriter 优化 [镜头提示词] + [问题描述] /screenwriter 简化 [镜头提示词]
注意事项
- •总量控制:Storyboard ≤ 2000 字
- •8要素完整 = 大师级
- •根据平台调整镜头定位语法
- •负面提示:建议添加 "无水印、无字幕、无文字叠加"
- •每次输出前自检:时长、字数、8要素、叙事衔接是否全部满足