This skill should be used when the user asks to "复用一个GitHub项目", "跑通一个开源项目", "clone并运行训练", "搭建训练环境", "准备数据集", "配置训练参数", "冒烟测试", "跑通训练/测试", mentions "GitHub项目复用", "深度学习项目部署", "开源项目落地", or provides a GitHub link for an ML/DL project they want to run. Covers the full lifecycle from git clone to successful training.
npx claudepluginhub lidapengpeng/github-reuse-assistantThis skill uses the workspace's default tool permissions.
提供一套结构化的 6 阶段方法论,将任意 ML/DL GitHub 项目从 clone 代码推进到成功训练和测试。核心原则:**先跑通、再定制**,遇到不确定之处先提问、不猜测关键参数。
Executes documented training commands in deep learning research repos for startup verification, short-run checks, full kickoff, or resume, capturing status, checkpoints, and metrics to train_outputs/.
Onboards users to MLflow by analyzing codebase for GenAI (LLMs, LangChain) or traditional ML (sklearn, PyTorch) use cases and guiding through quickstart tutorials and integrations.
Share bugs, ideas, or general feedback.
提供一套结构化的 6 阶段方法论,将任意 ML/DL GitHub 项目从 clone 代码推进到成功训练和测试。核心原则:先跑通、再定制,遇到不确定之处先提问、不猜测关键参数。
根据用户提供的 GitHub 链接:
git clone 命令及推荐本地目录启动 repo-researcher Agent,执行以下调研:
https://deepwiki.com/{owner}/{repo})理解项目架构PROJECT_NOTES.md 到项目根目录笔记文件结构参见 references/project-notes-template.md。
关键:此笔记是后续所有阶段的参考依据,在阶段 5 修改配置和阶段 6 训练排错时需回顾。
启动 env-checker Agent(可与阶段 2 并行),执行:
对拿不准的版本兼容问题(如 CUDA 与 PyTorch 对应关系),先向用户确认。
交互确认后启动 data-inspector Agent:
PROJECT_NOTES.md 中的数据格式要求data_check/convert_dataset.pydata_check/ 目录:
可视化结果判定标准参见 references/data-validation-standards.md。
configs/),回顾 PROJECT_NOTES.md{数据集}_{模型}_{日期}.py)references/config-checklist.md 中的参数清单PROJECT_NOTES.md 的修改日志采用「先验证再正式」策略:
阶段 A - 冒烟测试:
references/error-diagnosis.md)阶段 B - 自动 Batch Size 搜索(目标:GPU 显存利用率 ~95%):
冒烟测试通过后,自动执行二分搜索找到最优 batch size:
nvidia-smi 获取 GPU 总显存和当前空闲显存[冒烟测试 batch_size, 冒烟测试 batch_size * 16]nvidia-smi 采样峰值显存占用lr_new = lr_base * batch_new / batch_base具体搜索脚本参见 references/batch-size-finder.md。
阶段 C - 正式训练:
按以下结构输出:
references/project-notes-template.md - PROJECT_NOTES.md 完整模板(含预训练权重章节、修改日志)references/error-diagnosis.md - 训练常见错误 → 自动诊断建议映射表references/config-checklist.md - 配置文件关键参数清单references/data-validation-standards.md - 数据可视化结果判定标准references/batch-size-finder.md - 自动 Batch Size 二分搜索策略与显存采样方法