將訓練好的模型部署到 HuggingFace Hub 和本地 Ollama。
Deploys trained models to HuggingFace Hub and local Ollama with validation checks.
/plugin marketplace add p988744/nlp-skills/plugin install p988744-nlp-skills@p988744/nlp-skills將訓練好的模型部署到 HuggingFace Hub 和本地 Ollama。
$1: 任務名稱$2: 版本號(可選,預設為當前版本)檢查:
如果效能未達標:
⚠️ 效能未達標
當前: Macro-F1 = 72%
目標: Macro-F1 ≥ 80%
確定要繼續部署嗎?
□ 是,強制部署
□ 否,返回改善
使用 AskUserQuestion 詢問:
要部署到哪些平台?
□ HuggingFace Hub - 上傳 LoRA adapter
□ HuggingFace Hub - 上傳合併模型(vLLM 用)
□ HuggingFace Hub - 上傳 GGUF(Ollama 用)
□ HuggingFace Hub - 上傳資料集
□ 本地 Ollama - 建立本地模型
如果選擇 HuggingFace,確認配置:
huggingface:
org: your-org # HF 組織或使用者名稱
prefix: your-prefix # 模型前綴
# 將生成的 repo 名稱:
# - {prefix}-{task_name}-adapter
# - {prefix}-{task_name}-vllm
# - {prefix}-{task_name}-gguf
# - {prefix}-{task_name}-data
詢問使用者確認或修改這些設定。
python scripts/06_upload_hf.py --merge-adapter
python scripts/06_upload_hf.py --convert-gguf --quantization q8_0
量化選項:
q8_0: 8-bit 量化(推薦,品質/大小平衡)q4_k_m: 4-bit 量化(更小,略有品質損失)f16: 半精度(最大,最高品質)# 上傳 adapter
python scripts/06_upload_hf.py --upload adapter
# 上傳合併模型
python scripts/06_upload_hf.py --upload merged
# 上傳 GGUF
python scripts/06_upload_hf.py --upload gguf
# 上傳資料集
python scripts/06_upload_hf.py --upload dataset
為每個 repo 生成對應的 Model Card:
# {model_name}
## Model Description
{description}
## Training Details
- Base Model: {base_model}
- Method: {method}
- Dataset: {dataset_size} examples
## Performance
| Metric | Score |
|--------|-------|
| Macro-F1 | {score}% |
## Usage
...
# 建立 Modelfile
cd $1/models/gguf
cat > Modelfile << EOF
FROM ./{model_name}-q8_0.gguf
SYSTEM "{system_prompt}"
EOF
# 建立 Ollama 模型
ollama create {task_name} -f Modelfile
# 測試
ollama run {task_name} "測試輸入"
更新 task.yaml:
status: deployed
deployed_at: {timestamp}
deployment:
huggingface:
adapter: {repo_url}
gguf: {repo_url}
vllm: {repo_url}
dataset: {repo_url}
ollama:
model_name: {task_name}
更新 versions/{version}/lineage.yaml:
deployment:
deployed_at: {timestamp}
huggingface:
adapter: {repo_url}
gguf: {repo_url}
ollama:
model_name: {task_name}
部署完成!
HuggingFace:
- Adapter: https://huggingface.co/{org}/{prefix}-{task}-adapter
- GGUF: https://huggingface.co/{org}/{prefix}-{task}-gguf
- vLLM: https://huggingface.co/{org}/{prefix}-{task}-vllm
- Dataset: https://huggingface.co/datasets/{org}/{prefix}-{task}-data
Ollama:
- 模型名稱: {task_name}
- 測試: ollama run {task_name} "你的輸入"
整合指南: {task_name}/docs/integration-guide.md
huggingface-cli loginollama --version