From agent-core
Application development using Planner→Generator→Evaluator multi-agent harness with QA-verified quality. Trigger phrases: "アプリ作って", "harness run", "開発して", "アプリ開発", "full app", "作って"
How this skill is triggered — by the user, by Claude, or both
Slash command
/agent-core:harness-runThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
Generator-Evaluator 分離パターンでアプリ開発を行う。
Generator-Evaluator 分離パターンでアプリ開発を行う。
解決する問題:
設計原則:
開始前に確定。既存プロジェクトならマーカーファイルから検出、新規なら質問:
| Marker | Stack | Build | Run | Test |
|---|---|---|---|---|
| package.json | Node.js | npm run build | npm run dev | npm test |
| pubspec.yaml | Flutter | flutter build | flutter run | flutter test |
| Package.swift | Swift | swift build | swift run | swift test |
| pyproject.toml | Python | pip install -e . | python main.py | pytest |
| Cargo.toml | Rust | cargo build | cargo run | cargo test |
| go.mod | Go | go build | go run . | go test ./... |
| App Type | Tool |
|---|---|
| Web app | agent-browser CLI(Bash 経由、200-400 tokens/page) |
| Mobile | mobile-mcp |
| CLI / API | Bash |
agent-browser 未インストール時: npm install -g agent-browser && agent-browser install
曖昧な入力を構造化する。 ユーザーの説明が十分に具体的でない場合、Planning に進む前に設計を練る。
| 入力の状態 | 判定 | 例 |
|---|---|---|
| 具体的な機能・画面が列挙されている | → Phase 1 へスキップ | 「Todoアプリ。追加・削除・完了・フィルター機能」 |
| 1文の概要のみ / 抽象的 | → Phase 0 実行 | 「なんかいい感じのダッシュボード作って」 |
| 「〜みたいなやつ」「〜的な」 | → Phase 0 実行 | 「Notion みたいなメモアプリ」 |
Anti-pattern: 「これはシンプルだから設計不要」 — シンプルに見えるものほど暗黙の要件が多い。Phase 0 をスキップする判断は Gate の基準のみで行う。
spawn harness-planner に以下を渡す:
$ARGUMENTS)または Phase 0 の設計出力Planner は仕様に加えて 実装チェックリスト を出力する:
Planner が仕様を返したらユーザーに提示して承認を得る。承認後のみ Phase 2 へ。
spawn harness-generator に以下を渡す:
Generator は RED-GREEN-REFACTOR サイクルに従う:
例外(TDD 緩和が許される Stack/場面):
ビルドエラーや想定外の挙動が発生した場合:
Generator はバグを「構造的に不可能にする」設計を心がける:
| Layer | Purpose | Example |
|---|---|---|
| 1. Entry Point | API 境界でのバリデーション | 入力値チェック、型検証 |
| 2. Business Logic | ドメインルールの強制 | 不正な状態遷移の防止 |
| 3. Environment | コンテキスト固有の安全装置 | 環境変数の検証 |
| 4. Debug Logging | 障害診断の最終手段 | 構造化ログ |
Generator は isolation: "worktree" で spawn する。失敗しても main を汚さない。
Generator がコンテキスト劣化の兆候を報告した場合:
harness-generator を spawn し、Handoff + 残タスクを渡すspawn harness-evaluator に以下を渡す:
Generator とは別のエージェントであること。同一エージェントに評価させない。
全 Acceptance Criteria を1つずつ検証: PASS / FAIL / PARTIAL
Stage 1 を全 PASS した場合のみ実行:
| Criterion | Weight |
|---|---|
| Product Depth | 30% |
| Functionality | 30% |
| Visual/UX | 20% |
| Code Quality | 20% |
なぜ 2 段階か: 仕様未達のまま品質を磨く無駄を防ぐ。
ITERATE の場合:
QA Report の issues が独立している場合、複数の Generator を並列 spawn する:
| 判定 | アクション |
|---|---|
| Issues が異なるファイル/機能に属する | → 並列 Generator spawn |
| Issues が同一機能内で相互依存 | → 直列 Generator(従来通り) |
| 1件のみ | → 単一 Generator |
各 Generator は以下の手順で修正:
harness-evaluator で再 QAPASS 後、/simplify を実行してコードを整理する。
機能は Evaluator が保証済みなので、安全にリファクタリングできる。
Simplify 後、リファクタで壊れていないことを証明する。
証拠なき完了宣言の禁止: テスト結果・起動確認のログを提示してから Delivery に進む。
Final Verification 完了後にユーザーへ報告:
Generator・Evaluator が避けるべきテストパターン:
| Anti-Pattern | 問題 | 正しいアプローチ |
|---|---|---|
| Mock の動作をテスト | 本物の挙動を検証していない | 実際の依存を使うか、振る舞いベースでテスト |
| テスト専用メソッドを本番コードに追加 | テストのためだけに本番を汚す | Public API のみでテスト |
| 過剰な Mock | テストが実装詳細に密結合 | 外部境界のみ Mock |
| テスト間の状態汚染 | テスト順序で結果が変わる | 各テストで状態をリセット |
| ブリトルテスト | リファクタのたびにテストが壊れる | 振る舞いをテスト、実装をテストしない |
このスキルの改善を行う際は、敵対的テストで効果を実証する:
| Situation | Route to |
|---|---|
| 説明が曖昧 | Phase 0 Design Refinement |
| Build 中にエラー | Systematic Debugging → 根本原因調査 |
| Build 3-strike | delegation-triggers → GPT escalation |
| QA issues が独立 | Phase 4 Parallel Agent Dispatch |
| QA issues 多数・相互依存 | complex-orchestrator で並列修正 |
| 完了後レビュー | local-code-review |
npx claudepluginhub xmgrex/ccx-arsenal --plugin agent-coreOrchestrates end-to-end mobile feature development from description to running code with E2E tests via 6-phase pipeline: planning, implementation, testing, build-fix, quality gate, verification. Supports Android, iOS, KMP.
Creates iterative development plans for Replit Agent, breaking projects into phases with tasks, checkpoints, prompts, verification steps, and rollback strategies.
Autonomously generates complete production-ready projects from descriptions: structure, code, tests, docs, config, git. Orchestrates pipeline with verification to ensure builds and tests pass.