From delivery-plugin
Harness Engineering environmentを設計・scaffold・validateする。AI/agent eval と integration/regression harness の共通基盤を作り、cases・fixtures・reporting・CI・devcontainer を整える。Use when 「Harness環境を作って」「評価ハーネスを整備して」「回帰検証環境を構築して」 or 「benchmark/eval harness を仕込んで」と言われた時。
npx claudepluginhub caphtech/claude-marketplace --plugin delivery-pluginThis skill is limited to using the following tools:
Portable Core + TS-first の Harness Engineering 環境を current repo に追加する。
assets/templates/harness/cases/adversarial/agent-eval-adversarial.jsonassets/templates/harness/cases/edge/agent-eval-edge.jsonassets/templates/harness/cases/regression/software-regression.jsonassets/templates/harness/cases/smoke/software-smoke.jsonassets/templates/harness/fixtures/mocks/example-response.jsonassets/templates/harness/harness.config.jsonassets/templates/harness/package.jsonassets/templates/harness/src/cli.tsassets/templates/harness/src/config.tsassets/templates/harness/src/run.tsassets/templates/harness/src/validate.tsassets/templates/harness/tsconfig.jsonreferences/design-principles.mdreferences/extension-patterns.mdreferences/profiles.mdscripts/build.mjsscripts/package.jsonscripts/src/init.tsscripts/src/shared.tsscripts/src/validate.tsGuides harness engineering for AI agents: context/memory management, guardrails, AGENTS.md/CLAUDE.md repo instructions, evals, observability, and orchestration.
Sets up or updates agent-first engineering harness for repositories with AGENTS.md maps, docs structure, architecture boundaries, .harness rules, and quality scoring. Use to make repos AI agent-ready or audit readiness.
Presents menu of 8 pre-built harness use cases for research/analysis, content creation, media/marketing, engineering; launches selected one via harness:harness skill.
Share bugs, ideas, or general feedback.
Portable Core + TS-first の Harness Engineering 環境を current repo に追加する。
このスキルは以下を扱う:
init: ハーネス環境を scaffold するvalidate: scaffold 済み環境の整合性を検証するv1 は GitHub Actions と additive な devcontainer profile を標準にする。 他の CI や IDE 統合は extension-patterns.md を参照し、必要な時だけ拡張する。
スキルディレクトリ内の scripts/ で一度だけ依存を入れてビルドする。
cd scripts
npm install
npm run build
引数なしは init --profile hybrid --root . として扱う。
cd scripts
node dist/init.mjs --root . --profile hybrid
cd scripts
node dist/validate.mjs --root .
npm --prefix harness install
npm --prefix harness run smoke
init以下を current repo に追加する。
harness/ self-contained workspace.github/workflows/harness.yml.devcontainer/harness/devcontainer.jsoninit は既存ファイルを上書きしない。衝突があれば一覧を出して停止する。
validate以下をチェックする。
harness/harness.config.json の profile/targets/artifactsid 重複、mode/profile 整合、tag 妥当性init|validate
--profile hybrid|agent-eval|software
--root <path>
--profile default: hybrid--root default: .hybrid: software と agent-eval の両方を残すsoftware: software target と sample cases だけ残すagent-eval: trace/grader 向け sample を残すprofile 選定の判断基準は profiles.md を参照する。
scripts/dist/init.mjs は assets/templates/ を root へ展開し、profile に応じて config と sample cases を絞り込む。
設計原則や layout の意図が必要な時だけ design-principles.md を読む。
scripts/dist/validate.mjs で構造と case contract を検証する。
validation が通ったら、生成された harness/ workspace 側で以下を実行する。
npm --prefix harness install
npm --prefix harness run build
npm --prefix harness run validate
npm --prefix harness run smoke
外部 API mock、CI matrix 拡張、trace grading 強化は extension-patterns.md を参照する。
.devcontainer/devcontainer.json は触らないpackage.json は触らないharness/ 配下に閉じた workspace として追加する