Help us improve
Share bugs, ideas, or general feedback.
AI-assisted video editing workflow for cutting, structuring, and enhancing real footage using FFmpeg, Remotion, ElevenLabs, and fal.ai. Activates when users want to edit video, trim clips, make vlogs, or build video content.
npx claudepluginhub aaione/everything-claude-code-zhHow this skill is triggered — by the user, by Claude, or both
Slash command
/everything-claude-code:video-editingThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
AI 辅助编辑真实素材。不是从提示词生成。快速编辑现有视频。
Guides AI-assisted editing of real video footage: transcribe/plan cuts with Claude, execute via FFmpeg bash scripts, augment with Remotion/ElevenLabs/fal.ai, polish in Descript/CapCut.
AI-assisted video editing workflows that cut, structure, and augment real footage. Covers the full pipeline from raw capture through FFmpeg, Remotion, ElevenLabs, fal.ai, and final polish in Descript or CapCut.
Edits, processes, and renders videos using FFmpeg and Remotion. Handles stitching clips, transitions, captions, teasers, transcription via Whisper, and analysis with ffprobe.
Share bugs, ideas, or general feedback.
AI 辅助编辑真实素材。不是从提示词生成。快速编辑现有视频。
AI 视频编辑在你停止要求它创建整个视频,开始用它来压缩、结构化和增强真实素材时才有用。价值不在于生成。价值在于压缩。
Screen Studio / 原始素材
→ Claude / Codex
→ FFmpeg
→ Remotion
→ ElevenLabs / fal.ai
→ Descript 或 CapCut
每一层都有特定的工作。不要跳过层级。不要试图让一个工具做所有事情。
收集源材料:
videodb 技能)输出:准备好整理的原始文件。
使用 Claude Code 或 Codex 来:
示例提示:
"这是一段 4 小时录制的转录文本。找出 8 个最强片段
用于 24 分钟的 Vlog。给我每个片段的 FFmpeg 剪切命令。"
这一层关乎结构,而非最终创意品味。
FFmpeg 处理枯燥但关键的工作:分割、裁剪、拼接和预处理。
ffmpeg -i raw.mp4 -ss 00:12:30 -to 00:15:45 -c copy segment_01.mp4
#!/bin/bash
# cuts.txt: 开始,结束,标签
while IFS=, read -r start end label; do
ffmpeg -i raw.mp4 -ss "$start" -to "$end" -c copy "segments/${label}.mp4"
done < cuts.txt
# 创建文件列表
for f in segments/*.mp4; do echo "file '$f'"; done > concat.txt
ffmpeg -f concat -safe 0 -i concat.txt -c copy assembled.mp4
ffmpeg -i raw.mp4 -vf "scale=960:-2" -c:v libx264 -preset ultrafast -crf 28 proxy.mp4
ffmpeg -i raw.mp4 -vn -acodec pcm_s16le -ar 16000 audio.wav
ffmpeg -i segment.mp4 -af loudnorm=I=-16:TP=-1.5:LRA=11 -c:v copy normalized.mp4
Remotion 将编辑问题转化为可组合的代码。用于传统编辑器难以处理的事情:
import { AbsoluteFill, Sequence, Video, useCurrentFrame } from "remotion";
export const VlogComposition: React.FC = () => {
const frame = useCurrentFrame();
return (
<AbsoluteFill>
{/* 主要素材 */}
<Sequence from={0} durationInFrames={300}>
<Video src="/segments/intro.mp4" />
</Sequence>
{/* 标题叠加 */}
<Sequence from={30} durationInFrames={90}>
<AbsoluteFill style={{
justifyContent: "center",
alignItems: "center",
}}>
<h1 style={{
fontSize: 72,
color: "white",
textShadow: "2px 2px 8px rgba(0,0,0,0.8)",
}}>
AI 编辑技术栈
</h1>
</AbsoluteFill>
</Sequence>
{/* 下一个片段 */}
<Sequence from={300} durationInFrames={450}>
<Video src="/segments/demo.mp4" />
</Sequence>
</AbsoluteFill>
);
};
npx remotion render src/index.ts VlogComposition output.mp4
详见 Remotion 文档获取详细模式和 API 参考。
只生成你需要的内容。不要生成整个视频。
import os
import requests
resp = requests.post(
f"https://api.elevenlabs.io/v1/text-to-speech/{voice_id}",
headers={
"xi-api-key": os.environ["ELEVENLABS_API_KEY"],
"Content-Type": "application/json"
},
json={
"text": "你的旁白文本",
"model_id": "eleven_turbo_v2_5",
"voice_settings": {"stability": 0.5, "similarity_boost": 0.75}
}
)
with open("voiceover.mp3", "wb") as f:
f.write(resp.content)
使用 fal-ai-media 技能进行:
用于不存在的插入镜头、缩略图或 B-roll:
generate(app_id: "fal-ai/nano-banana-pro", input_data: {
"prompt": "科技 Vlog 专业缩略图,深色背景,屏幕上的代码",
"image_size": "landscape_16_9"
})
如果 VideoDB 已配置:
voiceover = coll.generate_voice(text="此处为旁白", voice="alloy")
music = coll.generate_music(prompt="编程 Vlog 的 lo-fi 背景音乐", duration=120)
sfx = coll.generate_sound_effect(prompt="微弱的嗖嗖转场音效")
最后一层是人的工作。使用传统编辑器进行:
品味在这里体现。AI 清除重复性工作。你做最终决定。
不同平台需要不同的宽高比:
| 平台 | 宽高比 | 分辨率 |
|---|---|---|
| YouTube | 16:9 | 1920x1080 |
| TikTok / Reels | 9:16 | 1080x1920 |
| Instagram 动态 | 1:1 | 1080x1080 |
| X / Twitter | 16:9 或 1:1 | 1280x720 或 720x720 |
# 16:9 转 9:16(居中裁剪)
ffmpeg -i input.mp4 -vf "crop=ih*9/16:ih,scale=1080:1920" vertical.mp4
# 16:9 转 1:1(居中裁剪)
ffmpeg -i input.mp4 -vf "crop=ih:ih,scale=1080:1080" square.mp4
from videodb import ReframeMode
# 智能重新构架(AI 引导的主体跟踪)
reframed = video.reframe(start=0, end=60, target="vertical", mode=ReframeMode.smart)
# 检测场景变化(阈值 0.3 = 中等灵敏度)
ffmpeg -i input.mp4 -vf "select='gt(scene,0.3)',showinfo" -vsync vfr -f null - 2>&1 | grep showinfo
# 查找静音片段(适用于剪切空白时段)
ffmpeg -i input.mp4 -af silencedetect=noise=-30dB:d=2 -f null - 2>&1 | grep silence
使用 Claude 分析转录文本 + 场景时间戳:
"根据这个带时间戳的转录文本和这些场景变化点,
识别 5 个最适合社交媒体的 30 秒片段。"
| 工具 | 优势 | 劣势 |
|---|---|---|
| Claude / Codex | 整理、规划、代码生成 | 不是创意品味层 |
| FFmpeg | 确定性剪切、批处理、格式转换 | 无可视化编辑界面 |
| Remotion | 可编程叠加层、可组合场景、可复用模板 | 非开发者有学习曲线 |
| Screen Studio | 即刻生成精美屏幕录制 | 仅限屏幕捕获 |
| ElevenLabs | 语音、旁白、音乐、音效 | 不是工作流中心 |
| Descript / CapCut | 最终节奏、字幕、润色 | 手动操作,不可自动化 |
fal-ai-media — AI 图像、视频和音频生成videodb — 服务端视频处理、索引和流媒体content-engine — 平台原生内容分发