From zenbu-powers
驗收標準對齊評估方法論。給定用戶原始任務需求 + 上游 agent 產出,本 SKILL 提供萃取 testable criteria、4 大評估維度、報告格式、與 reviewer agents 的職責邊界、以及 WEB / 桌面 / CLI / 純文件的驗收手法分流。供 acceptance-evaluator agent 載入;orchestrator 直接 evaluate 簡單任務時也可參考。
npx claudepluginhub zenbuapps/zenbu-powers --plugin zenbu-powersThis skill uses the workspace's default tool permissions.
當 orchestrator(main agent)面臨以下情境之一,且需要對「產出是否符合用戶意圖」做明確判定時:
Searches, retrieves, and installs Agent Skills from prompts.chat registry using MCP tools like search_skills and get_skill. Activates for finding skills, browsing catalogs, or extending Claude.
Checks Next.js compilation errors using a running Turbopack dev server after code edits. Fixes actionable issues before reporting complete. Replaces `next build`.
Guides code writing, review, and refactoring with Karpathy-inspired rules to avoid overcomplication, ensure simplicity, surgical changes, and verifiable success criteria.
Share bugs, ideas, or general feedback.
當 orchestrator(main agent)面臨以下情境之一,且需要對「產出是否符合用戶意圖」做明確判定時:
不適用(orchestrator 自行判斷即可):
| 角色 | 審查軸 | 例子 |
|---|---|---|
*-reviewer agents | Code 品質(best practice、安全、效能、可維護性) | react-reviewer 看 hook 用法、wordpress-reviewer 看 nonce、security-reviewer 看 OWASP |
| acceptance-evaluator | 用戶意圖對齊(需求覆蓋、邊界完整、off-topic 偵測) | 用戶要 A 結果做了 B 嗎?該包進去的邊界有缺漏嗎?產出有沒有偏題? |
兩者正交不重疊。詳見 references/scope-boundary.md。
從用戶原始任務 + 上下文萃取可驗收的具體標準。詳見 references/extracting-testable-criteria.md。
若 orchestrator dispatch 時已提供 criteria,直接用;若未提供,本 SKILL 教你怎麼自行推導並在報告中標明來源。
先過 Reality Check 前置鐵律,再走 4 大維度:
主動掃描產出中所有反向訊號(錯誤、警告、未啟用、不可用)+ 驗證第三方依賴可用性 + 走完證據鏈到最終狀態。 不可假設「沒看到 = 沒發生」、不可把過程訊號(跳轉成功、exit 0、200)當現實訊號。
詳見 references/zero-assumption-verification.md(必讀,列入強制前置動作)。
詳見 references/evaluation-dimensions.md。
不同專案類型的「驗收動作」不同:
| 專案類型 | 驗收手法 |
|---|---|
| WEB 應用 | playwright-cli SKILL 跑互動 + 截圖;或 Claude in Chrome 直連 |
| 桌面 / GUI 應用 | 要求 orchestrator/用戶提供截圖(無法自動化) |
| CLI / API | 跑指令、Read 輸出檔、grep 關鍵字 |
| 純文件 / 規格 | Read 對照、語意一致性檢查 |
詳見 references/project-type-verification.md。
依標準格式輸出,二元判定 PASS / FAIL,逐條對應 criterion。詳見 references/report-template.md。
| 檔案 | 用途 | 何時讀 |
|---|---|---|
| zero-assumption-verification.md | 零假設驗收原則 + 反向訊號清單 + 強制前置動作(鐵律) | Step 2 之前必讀 |
| extracting-testable-criteria.md | 從用戶任務萃取可驗收標準的方法 | Step 1 必讀 |
| evaluation-dimensions.md | Reality Check + 4 大評估維度的判斷準則與範例 | Step 2 必讀 |
| project-type-verification.md | WEB / 桌面 / CLI / 純文件的驗收手法分流(含反向訊號清單) | Step 3 必讀 |
| report-template.md | 標準報告格式範本(含反向訊號掃描結果欄位) | Step 4 必讀 |
| scope-boundary.md | 與 reviewer agents 的職責邊界守則 | 遇到「這該不該管」的灰色地帶時讀 |
zero-assumption-verification.md)