SCALE Engine v0.12.3
SCALE Engine 是一个面向 AI 编码 Agent 的工程化工作流运行时。它把提示词里的工程纪律,下沉为状态机、质量门禁、持久化证据、确定性 review 记录和发布检查。
源码仓库:https://github.com/hongmaple0820/scale-engine
国内镜像:https://gitee.com/hongmaple/scale-engine
npm:https://www.npmjs.com/package/@hongmaple0820/scale-engine
语言:中文 | English
为什么需要它
提示词是建议,工程交付需要机制:
- Agent 可以声称测试通过,SCALE 会保存真实验证证据。
- Agent 可以跳过 review,SCALE 会在缺少 review 记录时阻断
ship。
- Agent 可以误提交无关文件,SCALE 只暂存已通过 review 覆盖的文件。
- Agent 可以丢失阶段状态,SCALE 会把 artifact 和 FSM 状态保存在
.scale。
当前版本
v0.11.1 新增四大优先级改进:
Phase Commands FSM 阻断
canTransition + process.exit(1) 确保 FSM guard 失败时阻塞流程,而非继续执行
- define/plan/build/verify 各阶段添加明确的阻断提示
OWASP Top 10 检测器
- 新增
OWASPDetector 覆盖 SQL 注入、XSS、路径遍历、SSRF、Auth Bypass、弱加密、CORS 错误配置、CSRF、文件上传、敏感数据泄露
- 19 类安全检测模式,自动识别 regex 定义避免误报
Browser QA Capability
BrowserQACapability 封装 Playwright MCP 工具
- 支持导航、点击、截图、console 检查、E2E 测试流程
L6 Evolution 自改进闭环
LessonExtractor 从会话 Defect 事件提取可复用教训
SelfImproveEngine 实现 Defect → Lesson → Rule → Hook 晋升流水线
- 新增 CLI 命令:
scale evolution extract/improve/report/hooks
完整阶段化交付链路:
define -> plan -> build -> verify -> review -> ship
- Spec、Plan、Task artifact 接入 FSM,guard 失败时阻断而非继续
- 验证门禁证据持久化
- 代码 review 记录持久化
- 确定性 review scanner 会阻断空
catch、@ts-ignore、focused test、危险 shell/git 命令和缺 G7 证据的安全敏感变更
- OWASP Top 10 安全检测器扩展安全覆盖
- G7 内置安全扫描会记录可解释的文件/行号证据,默认阻断 CRITICAL,严格模式可阻断 HIGH
- 可选严格 TDD evidence 门禁:
--tdd-evidence 和 --tdd-strict
ship --no-commit 交付报告
ship 发布前强制验证 review evidence
- 16 个平台适配器,12 个专业 Agent Profile
- Browser QA Capability (Playwright MCP)
- Evolution 自改进闭环
- 本轮加固后,499 个 Vitest 测试通过
安装
npm install -g @hongmaple0820/scale-engine
scale --version
需要 Node.js 20 或更高版本。
Vibe Templates(一键启动)
内置高质量提示词模板,无需输入复杂指令:
# 查看所有模板
scale vibe
# 使用组合包启动完整 MVP 流程
scale vibe --pack full-mvp --app "MyExpenseTracker"
# 单阶段生成提示词
scale vibe --phase prd --app "MyApp" --output docs/PRD-MyApp.md
6 阶段流程:
| 阶段 | 命令 | 预估时间 |
|---|
| idea | scale vibe --phase idea | 15-20 min |
| research | scale vibe --phase research | 20-30 min |
| prd | scale vibe --phase prd | 15-20 min |
| design | scale vibe --phase design | 15-20 min |
| agents | scale vibe --phase agents | 1-2 min |
| build | scale vibe --phase build | 1-3 hrs |
详见 Vibe Templates 文档。
阶段工作流
scale define "Scoped release workflow" \
--description "Implement a TypeScript CLI workflow with verification evidence, review records, rollback constraints, and release safety checks." \
--success-criteria "verify evidence is persisted,review evidence is persisted,ship blocks unreviewed files"
scale plan <spec-id> --rollback "Revert the release commit and remove generated artifacts"
scale build <plan-id> --description "Implement scoped release workflow"
scale verify <task-id>
scale review <task-id>
scale ship <task-id> --message "feat(workflow): add scoped release workflow"
如果只需要生成交付报告,不创建 Git commit:
scale ship <task-id> --no-commit
需要严格校验 TDD 证据时:
scale verify <task-id> --tdd-strict --tdd-evidence .scale/tdd/<task-id>.json
TDD evidence JSON 需要包含 red、green、refactor、testFirst 且值都为 true。
Evolution 自改进闭环
从会话缺陷中提取教训,晋升为规则和 Hook:
# 从会话提取 Lessons
scale evolution extract <session-id>
# 运行自改进闭环:Defect → Lesson → Rule → Hook
scale evolution improve <session-id>
# 显示自改进报告
scale evolution report <session-id>
# 查看生成的 Hooks 配置
scale evolution hooks <session-id> --json
阈值配置:
- Lesson → Rule:需验证 3 次
- Rule → Active:需触发 10 次
- Rule → Hook:需触发 20 次
安全模型
| 层级 | 作用 |
|---|
| FSM | 阻止非法 artifact 状态流转 |
| GateSystem | 执行 build、lint、test、coverage、security 门禁 |
| EvidenceStore | 持久化验证证据,用于审计和发布门禁 |
| ReviewStore | 持久化确定性 review 记录 |
| ReviewAnalyzer | 扫描 diff 中的高风险代码、流程债和缺失安全证据 |
| Detectors | 检测暴力重试、过早完成、甩锅、忙碌假象等失败模式 |
| Ship gate | 发布前必须验证通过,并且 review evidence 必须存在且通过 |
ship 不再执行 git add .。它只会暂存已通过 review 记录覆盖的文件;如果 review 后出现新的可 review 变更,ship 会阻断并要求重新 review。
G7 SecurityGate 内置轻量安全扫描,覆盖硬编码密钥、私钥、TLS 校验关闭、eval/Function、原始 HTML 注入、危险 shell 命令、shell 执行和空 catch 等模式。兼容模式只阻断 CRITICAL;严格模式会同时阻断 HIGH。
支持的平台与角色