From unipus-office-plugin
将本地文件转换为 Markdown 并保存到 docs/ 目录,支持 Word、PDF、PPT、Excel、CSV、JSON、XML、HTML、TXT 格式。 自动检测语言,英文内容翻译为中文,中文内容直接输出。 只要用户提供了本地文件路径并有转换、保存或提取文档内容的意图,就必须使用此 skill—— 包括"把这个文件转成 Markdown"、"file to markdown"、"转换文档"、"本地文件转 Markdown"、 "把这个 Word/PDF/Excel 存成 md"、"文档内容提取"、"把文件内容整理到 docs 里"等场景。 即使用户没有明确说"Markdown",只要意图是把本地文档内容转存为文本,也应使用此 skill。
How this skill is triggered — by the user, by Claude, or both
Slash command
/unipus-office-plugin:unipus-office-file-to-markdownThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
将单个本地文件转换为 Markdown,保存到 `docs/` 目录,自动翻译英文内容为中文。
将单个本地文件转换为 Markdown,保存到 docs/ 目录,自动翻译英文内容为中文。
| 格式 | 扩展名 | 所需子依赖 |
|---|---|---|
| Word | .docx | markitdown[docx] |
.pdf | markitdown[pdf] | |
| PowerPoint | .pptx | markitdown[pptx] |
| Excel | .xlsx | markitdown[xlsx] |
| CSV | .csv | 核心包即可 |
| JSON | .json | 核心包即可 |
| XML | .xml | 核心包即可 |
| HTML | .html / .htm | 核心包即可 |
| 纯文本 | .txt | 核心包即可 |
执行转换前完成两步检查,任一失败立即中断。
核心包:
python -m markitdown --version
失败时输出:
✗ 缺少依赖:markitdown
请先安装:pip install markitdown
安装完成后重新运行此 skill
格式子依赖(按输入文件类型):
| 扩展名 | 检查命令 | 缺失时安装 |
|---|---|---|
.docx | python -c "import mammoth" | pip install 'markitdown[docx]' |
.pdf | python -c "import pdfminer" | pip install 'markitdown[pdf]' |
.pptx | python -c "import pptx" | pip install 'markitdown[pptx]' |
.xlsx | python -c "import openpyxl" | pip install 'markitdown[xlsx]' |
.csv .json .xml .html .txt | 无需额外检查 | — |
1. 依赖检查(见第二节)
2. 确认文件存在
3. 推断输出路径(见第四节)
4. 检查目标文件是否已存在:
├─ 否 → 新建流程
└─ 是 → 存量核对流程
python -m markitdown "/path/to/file.docx"
默认路径: 文件名去扩展名 → 转 kebab-case → docs/<文件名>.md
report-Q1.docx → docs/report-q1.md
API Reference.pdf → docs/api-reference.md
data.csv → docs/data.md
meeting notes.txt → docs/meeting-notes.md
用户可覆盖目标路径:
"把 report.docx 存到 docs/archive/q1.md"
→ 保存到 docs/archive/q1.md
路径推断规则:
docs/检测方式:
取转换后 Markdown 文本的前 500 字符,跳过代码块(``` 包裹)、行内代码( 包裹)和 URL,统计 CJK 字符(一-鿿`)占比:
15% 的阈值来自实践:纯中文文本 CJK 占比通常 ≥ 60%,中英混排也往往超过 20%;低于 15% 基本可确认为英文或代码主导文档,翻译是合理的。
翻译保护规则(以下内容保持原文不变):
✓ docs/report-q1.md(已转换,中文原文)
✓ docs/api-reference.md(已转换,已翻译为中文)
✓ docs/data.md(已存在,已补全 2 处)
✗ docs/report.md — 缺少依赖 markitdown[pdf],请运行:pip install 'markitdown[pdf]'
✗ docs/unknown.xyz — 不支持的文件格式(.xyz)
| 情况 | 处理方式 |
|---|---|
| markitdown 核心包未安装 | 立即中断,输出安装指引 |
| 格式对应子依赖未安装 | 立即中断,输出对应 pip 安装命令 |
| 文件路径不存在 | 报错并中断:✗ 文件不存在:<路径> |
| 不支持的文件格式 | 报错并中断:✗ 不支持的文件格式(.<ext>) |
| 转换结果为空 | 警告并跳过,不写入空文件:✗ 转换结果为空,跳过 |
| 目标目录无写权限 | 报告错误并中断 |
| 文件已存在 | 不覆盖,执行存量核对流程 |
npx claudepluginhub glepooek/unipus-plugins-official --plugin unipus-office-pluginCreates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.