Help us improve
Share bugs, ideas, or general feedback.
npx claudepluginhub joshuarweaver/cascade-code-general-misc-1 --plugin tubone24-claude-code-settingsHow this skill is triggered — by the user, by Claude, or both
Slash command
/claude-code-settings:operationsThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
本番環境の信頼性を維持するためのベストプラクティスとワークフロー。
Implements SRE practices for production reliability: SLO/SLI definitions, monitoring/alerting, chaos engineering, incident runbooks, capacity planning. Handles brownfield extensions.
Provides checklists and best practices for CI/CD pipelines, Docker builds, monitoring/alerting setups, infrastructure defaults, and incident response to ship reliably and debug production issues.
Guides DevOps practices: CI/CD (GitHub Actions/GitLab CI), Docker containerization, Kubernetes orchestration, monitoring (Prometheus/Grafana), IaC (Terraform), logging, SRE, DORA metrics.
Share bugs, ideas, or general feedback.
本番環境の信頼性を維持するためのベストプラクティスとワークフロー。
| 領域 | 内容 |
|---|---|
| CI/CD | ビルド、テスト、デプロイ自動化 |
| モニタリング | メトリクス、ログ、トレース |
| アラート | 閾値設定、オンコール |
| インシデント対応 | 検知、対応、ポストモーテム |
| SRE | SLO、エラーバジェット |
# PR時
lint → type-check → test → build → preview deploy
# main マージ時
lint → type-check → test → build → staging deploy → smoke test → prod deploy
可用性 SLO: 99.9%(月間43分のダウンタイム許容)
レイテンシー SLO: p99 < 500ms
エラー率 SLO: < 0.1%
検知 → トリアージ → 対応 → 復旧 → ポストモーテム
references/cicd-patterns.md - CI/CDパターン集references/monitoring-setup.md - モニタリング設定references/incident-response.md - インシデント対応references/sre-practices.md - SRE実践ガイド