Help us improve
Share bugs, ideas, or general feedback.
From yuyile-skills
Splits scripts/stories into scene-by-scene video generation prompts with structured segments (characters, props, scene, sound, mood, shots) for Seedance 2.0, Kling, and Jimeng.
npx claudepluginhub ttfake92-lab/skillsHow this skill is triggered — by the user, by Claude, or both
Slash command
/yuyile-skills:mx-shell-promptThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
把一段脚本(故事、口播稿、场景描述,甚至一句粗略想法)**自动拆成板块**,每个板块产出一条完整、可直接复制的电影级视频提示词。
Generates structured text storyboards for video production. Walks through video type, theme, and duration, then outputs scene-by-scene descriptions with timing, visuals, and sound effects.
Acts as AI creative director for video production including product ads, short films, montages, TikTok e-commerce. Analyzes inputs, writes English prompts, generates assets, submits tasks.
Transforms user storytelling prompts into structured video scripts (JSON) with visual cue tags, voice selection, and orientation settings for a video generator tool.
Share bugs, ideas, or general feedback.
把一段脚本(故事、口播稿、场景描述,甚至一句粗略想法)自动拆成板块,每个板块产出一条完整、可直接复制的电影级视频提示词。
主战场是结构化分镜类工具:Seedance 2.0 / Kling / 即梦。这类工具吃的就是「分板块 + 分镜 + {{Portrait N}} 图片绑定」的中文结构化 prompt。(Sora / Runway / Pika 更吃英文流畅散文 prompt,本格式不是为它们设计的——如需输出给这类工具,把结构化内容改写成英文电影化段落并去掉 {{Portrait}} 引用。)
核心理念:
输入通常是一整段脚本/故事/口播稿。先把它切成板块。切分边界:
不要过度切分:同一地点的连续动作就是一个板块,哪怕它很长(板块内部可以走长镜头或多分镜)。也不要切得太粗:一个板块塞下两个不相干的场景,会超出单次生成能力。
先给分段概览再展开——列出板块清单让用户确认,避免在错误的分段上浪费整篇输出:
我把脚本拆成 N 个板块:
板块一:[一句话场景摘要]
板块二:[一句话场景摘要]
...
确认这个分段吗?要合并/拆开某块直接说。(说「直接写」我就按这个展开)
如果输入只是一句话或粗略想法 → 视为单板块,跳过确认直接补全。 如果信息不足以写出高质量提示词,问 2-3 个关键问题:目标工具?视觉风格偏好?整体画幅(16:9 横屏 / 9:16 竖屏 / 2.39:1 宽荧幕)?
阅读 references/template.md 了解结构骨架。每个板块包含 6 个部分:
基础设定(角色):每个角色 —— 外貌体型、服装、标志性特征、气质/性格。有参考图用 {{Portrait N}} 标记关联。
道具:影响画面或剧情的关键物件 —— 不只是列出来,要写清状态和与角色/事件的关系(不是「一把枪」,而是「插在枪套里的左轮,枪身有磨损划痕」)。道具是连贯性最容易丢的地方,单列一栏强制交代。
场景:环境类型、时间、天气、空间布局、氛围细节。具体到能「闻到」—— 不是「一个房间」,而是「午后阳光透过百叶窗洒进来的书房,灰尘在光柱中漂浮」。
声音:默认「不需要配乐,仅保留同期声」。用户明确要求音乐或氛围音时再调整。
氛围与画质(阅读 references/cinematic-vocabulary.md 选词):
阅读 references/shot-catalog.md 选景别、构图、运镜。根据板块内容自动选形式:
无论哪种,每个镜头(或长镜头的每个阶段)都写四要素:
时长 → 镜头数(粗略,单镜头约 2-5s):5s ≈ 1 个长镜头或 1-2 分镜;10s ≈ 2-3 分镜;15s ≈ 3-4 分镜;30s ≈ 5-7 分镜。
多分镜设计原则:相邻镜头景别要有变化;运镜节奏跟随情绪(紧张推进、平静固定);留一个「呼吸镜头」(全/远景)让观众喘息;首尾镜头呼应或对比。
角色、风格核心、画幅在第一个板块定义清楚,后续板块直接复用,只写变化(换了衣服、换了地点、道具状态变了)。这样多板块串起来才是同一部片子,而不是几条无关片段。
输出全部板块的完整 copy-paste-ready 提示词。然后问:「需要调整分段、改某个板块的风格、增减镜头、或把某块从分镜改成长镜头吗?」
视觉要超具体:不是「漂亮的日落」,而是「金色夕阳穿过百叶窗投下长影,皮肤上温暖的琥珀色调,画面边缘柔和的镜头光晕」。
动作要有物理精度:不是「角色很害怕」,而是「双手缓缓抬至下巴前方呈防御姿态,身体微微发抖,重心下沉」。
必须有摄影语言:每个镜头都含景别 + 构图 + 运镜。这三者定义了电影感的 80%。
道具要交代状态:道具单列,写清它的样子、状态、和角色的关系——这是画面连贯性最容易丢的地方。
角色描述保持一致:基础设定中写过的特征,分镜里不重复,只写动作和表情变化。跨板块同理。
节奏设计:紧张场景短镜头快切,抒情场景长镜头慢推。镜头时长要有变化。
负面指令集中在风格核心:「禁止游戏CG感」「禁止动作僵硬」放风格核心,不散落到每个镜头。
板块一:[场景摘要]
【基础设定】
角色1:{{Portrait N}} [外貌、服装、特征、气质]
角色2:{{Portrait N}} [外貌、服装、特征、气质]
【道具】
[关键道具:样子、状态、与角色/事件的关系]
【场景】
[环境、时间、天气、空间、氛围]
【声音】
不需要配乐,仅保留同期声。
【氛围与画质】
风格核心:[风格关键词]、电影级质感、超写实、真人实景拍摄、杜绝游戏CG感。
视觉基调:[摄影机] + [镜头]([附加效果])拍摄。
色彩与影调:[色彩方案],[胶片质感],[光线描述],[明暗关系],[画幅比例]。
风格参考:[导演/影视参考]。(可选)
【画面内容】
分镜一:
景别:[景别,具体说明拍哪里]
构图:[构图描述]
运镜手法:[运镜]
画面内容:[具体内容]
分镜二:
...
[—— 或长镜头形式 ——]
长镜头(一镜到底):
起:景别/构图/运镜 + 画面内容
承:景别/构图/运镜 + 画面内容
转:景别/构图/运镜 + 画面内容
——————————
板块二:[场景摘要]
(角色/风格已在板块一定义,此处只写变化)
【基础设定】[沿用板块一,仅说明变化]
...
| 情绪/场景 | 推荐术语 |
|---|---|
| 害怕/恐惧 | 浅景深、手持晃动、快速推进、冷色调 |
| 惊讶/揭示 | 缓慢前推、移焦(从前景到主体)、停顿 |
| 动作/追逐 | 甩镜、速度变化、低角度跟踪、高对比 |
| 浪漫/温柔 | 柔焦、暖色调、缓慢推轨、特写 |
| 紧张/悬疑 | 固定全景、沉默、缓慢变焦、暗调 |
| 孤独/沉思 | 远景留白、固定机位、自然光、低饱和 |
| 欢乐/活力 | 手持跟拍、高饱和、明亮光线、中景 |
| 史诗/壮丽 | 摇臂升降、远景、IMAX画幅、金色光线 |