This skill should be used when the user asks to "复用一个GitHub项目", "跑通一个开源项目", "clone并运行训练", "搭建训练环境", "准备数据集", "配置训练参数", "冒烟测试", "跑通训练/测试", mentions "GitHub项目复用", "深度学习项目部署", "开源项目落地", or provides a GitHub link for an ML/DL project they want to run. Covers the full lifecycle from git clone to successful training.
How this skill is triggered — by the user, by Claude, or both
Slash command
/github-reuse-assistant:ml-project-reuseThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
提供一套结构化的 6 阶段方法论,将任意 ML/DL GitHub 项目从 clone 代码推进到成功训练和测试。核心原则:**先跑通、再定制**,遇到不确定之处先提问、不猜测关键参数。
提供一套结构化的 6 阶段方法论,将任意 ML/DL GitHub 项目从 clone 代码推进到成功训练和测试。核心原则:先跑通、再定制,遇到不确定之处先提问、不猜测关键参数。
根据用户提供的 GitHub 链接:
git clone 命令及推荐本地目录启动 repo-researcher Agent,执行以下调研:
https://deepwiki.com/{owner}/{repo})理解项目架构PROJECT_NOTES.md 到项目根目录笔记文件结构参见 references/project-notes-template.md。
关键:此笔记是后续所有阶段的参考依据,在阶段 5 修改配置和阶段 6 训练排错时需回顾。
启动 env-checker Agent(可与阶段 2 并行),执行:
对拿不准的版本兼容问题(如 CUDA 与 PyTorch 对应关系),先向用户确认。
交互确认后启动 data-inspector Agent:
PROJECT_NOTES.md 中的数据格式要求data_check/convert_dataset.pydata_check/ 目录:
可视化结果判定标准参见 references/data-validation-standards.md。
configs/),回顾 PROJECT_NOTES.md{数据集}_{模型}_{日期}.py)references/config-checklist.md 中的参数清单PROJECT_NOTES.md 的修改日志采用「先验证再正式」策略:
阶段 A - 冒烟测试:
references/error-diagnosis.md)阶段 B - 自动 Batch Size 搜索(目标:GPU 显存利用率 ~95%):
冒烟测试通过后,自动执行二分搜索找到最优 batch size:
nvidia-smi 获取 GPU 总显存和当前空闲显存[冒烟测试 batch_size, 冒烟测试 batch_size * 16]nvidia-smi 采样峰值显存占用lr_new = lr_base * batch_new / batch_base具体搜索脚本参见 references/batch-size-finder.md。
阶段 C - 正式训练:
按以下结构输出:
references/project-notes-template.md - PROJECT_NOTES.md 完整模板(含预训练权重章节、修改日志)references/error-diagnosis.md - 训练常见错误 → 自动诊断建议映射表references/config-checklist.md - 配置文件关键参数清单references/data-validation-standards.md - 数据可视化结果判定标准references/batch-size-finder.md - 自动 Batch Size 二分搜索策略与显存采样方法npx claudepluginhub lidapengpeng/github-reuse-assistantAudits ML pipeline reproducibility, experiment tracking hygiene, and model versioning. Advises on serving patterns and prompt evaluation across MLflow, W&B, SageMaker, Vertex AI.
Determines a user's MLflow use case (GenAI or traditional ML) and guides them through relevant quickstart tutorials and initial integration steps.