Skill

video-editing

AI-assisted video editing workflow for cutting, structuring, and enhancing real footage using FFmpeg, Remotion, ElevenLabs, and fal.ai. Activates when users want to edit video, trim clips, make vlogs, or build video content.

FFmpeg

automation

Popularity

Stars

Forks

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/everything-claude-code:video-editing

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

AI 辅助编辑真实素材。不是从提示词生成。快速编辑现有视频。

SKILL.md

311 lines · ~1.5k tokens

Stats

LanguageJavaScript

Stars20

Forks9

MaintenanceExcellent

Last CommitJun 21, 2026

Actions

View Source View Plugin View on GitHub View README

视频编辑

AI 辅助编辑真实素材。不是从提示词生成。快速编辑现有视频。

何时激活

用户想要编辑、剪切或结构化视频素材
将长录制转换为短视频内容
从原始素材构建 Vlog、教程或演示视频
为现有视频添加叠加层、字幕、音乐或旁白
为不同平台（YouTube、TikTok、Instagram）重新构架视频
用户说"编辑视频"、"剪切这段素材"、"制作 Vlog"或"视频工作流"

核心论点

AI 视频编辑在你停止要求它创建整个视频，开始用它来压缩、结构化和增强真实素材时才有用。价值不在于生成。价值在于压缩。

流水线

Screen Studio / 原始素材
  → Claude / Codex
  → FFmpeg
  → Remotion
  → ElevenLabs / fal.ai
  → Descript 或 CapCut

每一层都有特定的工作。不要跳过层级。不要试图让一个工具做所有事情。

第 1 层：采集（Screen Studio / 原始素材）

收集源材料：

Screen Studio：用于应用演示、编码会话、浏览器工作流的精美屏幕录制
原始摄像头素材：Vlog 素材、访谈、活动录制
通过 VideoDB 的桌面捕获：带实时上下文的会话录制（参见 videodb 技能）

输出：准备好整理的原始文件。

第 2 层：整理（Claude / Codex）

使用 Claude Code 或 Codex 来：

转录和标记：生成转录文本，识别主题和话题
规划结构：决定保留什么、剪切什么、什么顺序合适
识别死区：查找停顿、跑题、重复拍摄
生成编辑决策列表：剪切的时间戳、保留的片段
搭建 FFmpeg 和 Remotion 代码：生成命令和合成

示例提示：
"这是一段 4 小时录制的转录文本。找出 8 个最强片段
用于 24 分钟的 Vlog。给我每个片段的 FFmpeg 剪切命令。"

这一层关乎结构，而非最终创意品味。

第 3 层：确定性剪切（FFmpeg）

FFmpeg 处理枯燥但关键的工作：分割、裁剪、拼接和预处理。

按时间戳提取片段

ffmpeg -i raw.mp4 -ss 00:12:30 -to 00:15:45 -c copy segment_01.mp4

从编辑决策列表批量剪切

#!/bin/bash
# cuts.txt: 开始,结束,标签
while IFS=, read -r start end label; do
  ffmpeg -i raw.mp4 -ss "$start" -to "$end" -c copy "segments/${label}.mp4"
done < cuts.txt

拼接片段

# 创建文件列表
for f in segments/*.mp4; do echo "file '$f'"; done > concat.txt
ffmpeg -f concat -safe 0 -i concat.txt -c copy assembled.mp4

创建代理文件以加快编辑

ffmpeg -i raw.mp4 -vf "scale=960:-2" -c:v libx264 -preset ultrafast -crf 28 proxy.mp4

提取音频用于转录

ffmpeg -i raw.mp4 -vn -acodec pcm_s16le -ar 16000 audio.wav

归一化音频电平

ffmpeg -i segment.mp4 -af loudnorm=I=-16:TP=-1.5:LRA=11 -c:v copy normalized.mp4

第 4 层：可编程合成（Remotion）

Remotion 将编辑问题转化为可组合的代码。用于传统编辑器难以处理的事情：

何时使用 Remotion

叠加层：文本、图片、品牌、字幕条
数据可视化：图表、统计、动画数字
动态图形：转场、说明动画
可组合场景：跨视频可复用的模板
产品演示：带注释的截图、UI 高亮

基本 Remotion 合成

import { AbsoluteFill, Sequence, Video, useCurrentFrame } from "remotion";

export const VlogComposition: React.FC = () => {
  const frame = useCurrentFrame();

  return (
    <AbsoluteFill>
      {/* 主要素材 */}
      <Sequence from={0} durationInFrames={300}>
        <Video src="/segments/intro.mp4" />
      </Sequence>

      {/* 标题叠加 */}
      <Sequence from={30} durationInFrames={90}>
        <AbsoluteFill style={{
          justifyContent: "center",
          alignItems: "center",
        }}>
          <h1 style={{
            fontSize: 72,
            color: "white",
            textShadow: "2px 2px 8px rgba(0,0,0,0.8)",
          }}>
            AI 编辑技术栈
          </h1>
        </AbsoluteFill>
      </Sequence>

      {/* 下一个片段 */}
      <Sequence from={300} durationInFrames={450}>
        <Video src="/segments/demo.mp4" />
      </Sequence>
    </AbsoluteFill>
  );
};

渲染输出

npx remotion render src/index.ts VlogComposition output.mp4

详见 Remotion 文档获取详细模式和 API 参考。

第 5 层：生成资产（ElevenLabs / fal.ai）

只生成你需要的内容。不要生成整个视频。

使用 ElevenLabs 的旁白

import os
import requests

resp = requests.post(
    f"https://api.elevenlabs.io/v1/text-to-speech/{voice_id}",
    headers={
        "xi-api-key": os.environ["ELEVENLABS_API_KEY"],
        "Content-Type": "application/json"
    },
    json={
        "text": "你的旁白文本",
        "model_id": "eleven_turbo_v2_5",
        "voice_settings": {"stability": 0.5, "similarity_boost": 0.75}
    }
)
with open("voiceover.mp3", "wb") as f:
    f.write(resp.content)

使用 fal.ai 的音乐和音效

使用 fal-ai-media 技能进行：

背景音乐生成
音效（用于视频转音频的 ThinkSound 模型）
转场音效

使用 fal.ai 的生成视觉

用于不存在的插入镜头、缩略图或 B-roll：

generate(app_id: "fal-ai/nano-banana-pro", input_data: {
  "prompt": "科技 Vlog 专业缩略图，深色背景，屏幕上的代码",
  "image_size": "landscape_16_9"
})

VideoDB 生成音频

如果 VideoDB 已配置：

voiceover = coll.generate_voice(text="此处为旁白", voice="alloy")
music = coll.generate_music(prompt="编程 Vlog 的 lo-fi 背景音乐", duration=120)
sfx = coll.generate_sound_effect(prompt="微弱的嗖嗖转场音效")

第 6 层：最终润色（Descript / CapCut）

最后一层是人的工作。使用传统编辑器进行：

节奏：调整感觉太快或太慢的剪切
字幕：自动生成，然后手动校对
调色：基本校正和氛围
最终音频混音：平衡人声、音乐和音效电平
导出：特定平台的格式和质量设置

品味在这里体现。AI 清除重复性工作。你做最终决定。

社交媒体重新构架

不同平台需要不同的宽高比：

平台	宽高比	分辨率
YouTube	16:9	1920x1080
TikTok / Reels	9:16	1080x1920
Instagram 动态	1:1	1080x1080
X / Twitter	16:9 或 1:1	1280x720 或 720x720

使用 FFmpeg 重新构架

# 16:9 转 9:16（居中裁剪）
ffmpeg -i input.mp4 -vf "crop=ih*9/16:ih,scale=1080:1920" vertical.mp4

# 16:9 转 1:1（居中裁剪）
ffmpeg -i input.mp4 -vf "crop=ih:ih,scale=1080:1080" square.mp4

使用 VideoDB 重新构架

from videodb import ReframeMode

# 智能重新构架（AI 引导的主体跟踪）
reframed = video.reframe(start=0, end=60, target="vertical", mode=ReframeMode.smart)

场景检测和自动剪切

FFmpeg 场景检测

# 检测场景变化（阈值 0.3 = 中等灵敏度）
ffmpeg -i input.mp4 -vf "select='gt(scene,0.3)',showinfo" -vsync vfr -f null - 2>&1 | grep showinfo

静音检测用于自动剪切

# 查找静音片段（适用于剪切空白时段）
ffmpeg -i input.mp4 -af silencedetect=noise=-30dB:d=2 -f null - 2>&1 | grep silence

高亮提取

使用 Claude 分析转录文本 + 场景时间戳：

"根据这个带时间戳的转录文本和这些场景变化点，
识别 5 个最适合社交媒体的 30 秒片段。"

每个工具最擅长的领域

工具	优势	劣势
Claude / Codex	整理、规划、代码生成	不是创意品味层
FFmpeg	确定性剪切、批处理、格式转换	无可视化编辑界面
Remotion	可编程叠加层、可组合场景、可复用模板	非开发者有学习曲线
Screen Studio	即刻生成精美屏幕录制	仅限屏幕捕获
ElevenLabs	语音、旁白、音乐、音效	不是工作流中心
Descript / CapCut	最终节奏、字幕、润色	手动操作，不可自动化

关键原则

编辑，而非生成。 此工作流用于剪切真实素材，而非从提示词创建。
结构先于风格。 在第 2 层把故事理顺，再触碰任何视觉内容。
FFmpeg 是骨干。 枯燥但关键。长素材在这里变得可管理。
Remotion 用于可重复性。 如果你将多次执行相同操作，把它做成 Remotion 组件。
选择性生成。 只对不存在的资产使用 AI 生成，不要用于所有内容。
品味是最后一层。 AI 清除重复性工作。你做最终创意决策。

video-editing

Popularity

Invocation

Context Preview

SKILL.md

video-editing

Popularity

Invocation

Context Preview

SKILL.md

视频编辑

何时激活

核心论点

流水线

第 1 层：采集（Screen Studio / 原始素材）

第 2 层：整理（Claude / Codex）

第 3 层：确定性剪切（FFmpeg）

按时间戳提取片段

从编辑决策列表批量剪切

拼接片段

创建代理文件以加快编辑

提取音频用于转录

归一化音频电平

第 4 层：可编程合成（Remotion）

何时使用 Remotion

基本 Remotion 合成

渲染输出

第 5 层：生成资产（ElevenLabs / fal.ai）

使用 ElevenLabs 的旁白

使用 fal.ai 的音乐和音效

使用 fal.ai 的生成视觉

VideoDB 生成音频

第 6 层：最终润色（Descript / CapCut）

社交媒体重新构架

使用 FFmpeg 重新构架

使用 VideoDB 重新构架

场景检测和自动剪切

FFmpeg 场景检测

静音检测用于自动剪切

高亮提取

每个工具最擅长的领域

关键原则

相关技能

Similar Skills

视频编辑

何时激活

核心论点

流水线

第 1 层：采集（Screen Studio / 原始素材）

第 2 层：整理（Claude / Codex）

第 3 层：确定性剪切（FFmpeg）

按时间戳提取片段

从编辑决策列表批量剪切

拼接片段

创建代理文件以加快编辑

提取音频用于转录

归一化音频电平

第 4 层：可编程合成（Remotion）

何时使用 Remotion

基本 Remotion 合成

渲染输出

第 5 层：生成资产（ElevenLabs / fal.ai）

使用 ElevenLabs 的旁白

使用 fal.ai 的音乐和音效

使用 fal.ai 的生成视觉

VideoDB 生成音频

第 6 层：最终润色（Descript / CapCut）

社交媒体重新构架

使用 FFmpeg 重新构架

使用 VideoDB 重新构架

场景检测和自动剪切

FFmpeg 场景检测

静音检测用于自动剪切

高亮提取

每个工具最擅长的领域

关键原则

相关技能

Similar Skills