Skill

monitoring-apis

Builds API monitoring with Prometheus metrics, Grafana dashboards, health checks, alerts, synthetic probes, and SLO tracking for performance and uptime.

Node

Popularity

Parent stars

2,199

Parent forks

296

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/api-monitoring-dashboard:monitoring-apis

User invocable

Model invocable

Inline context

Default effort

Tool Access

This skill is limited to the following tools:

ReadWriteEditGrepGlobBash(api:monitor-*)

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

Build real-time API monitoring with metrics collection (request rate, latency percentiles, error rates), health check endpoints, and alerting rules. Instrument API middleware to emit Prometheus metrics or StatsD counters, configure Grafana dashboards with SLO tracking, and implement synthetic monitoring probes for uptime verification.

Supporting Files

references/errors.mdreferences/examples.mdreferences/implementation.md

SKILL.md

79 lines · ~1.4k tokens

Stats

LanguagePython

Parent stars2,199

Parent forks296

MaintenanceExcellent

Last CommitApr 3, 2026

Actions

View Source View Plugin View on GitHub View README

Error	Cause	Solution
Metrics cardinality explosion	High-cardinality labels (user ID, request ID) on metrics	Use bounded label values only (method, status code, endpoint group); aggregate user-level data in logs
Health check false positive	Health endpoint returns 200 but dependent service is degraded	Include dependency checks with individual status; use structured response with `degraded` state
Alert fatigue	Too many low-severity alerts firing during normal operations	Tune alert thresholds using historical baselines; implement alert grouping and deduplication
Dashboard data gap	Metrics not collected during deployment rollout window	Configure Prometheus scrape interval < deployment duration; use push-based metrics during deploys
SLO miscalculation	Error budget calculation uses wrong time window or includes planned maintenance	Exclude maintenance windows from SLO calculation; align window with business reporting period

Error	Cause	Solution
Metrics cardinality explosion	High-cardinality labels (user ID, request ID) on metrics	Use bounded label values only (method, status code, endpoint group); aggregate user-level data in logs
Health check false positive	Health endpoint returns 200 but dependent service is degraded	Include dependency checks with individual status; use structured response with `degraded` state
Alert fatigue	Too many low-severity alerts firing during normal operations	Tune alert thresholds using historical baselines; implement alert grouping and deduplication
Dashboard data gap	Metrics not collected during deployment rollout window	Configure Prometheus scrape interval < deployment duration; use push-based metrics during deploys
SLO miscalculation	Error budget calculation uses wrong time window or includes planned maintenance	Exclude maintenance windows from SLO calculation; align window with business reporting period

monitoring-apis

Popularity

Invocation

Tool Access

Context Preview

Supporting Files

SKILL.md

monitoring-apis

Popularity

Invocation

Tool Access

Context Preview

Supporting Files

SKILL.md

Monitoring APIs

Overview

Prerequisites

Instructions

Output

Error Handling

Examples

Resources

Similar Skills

Monitoring APIs

Overview

Prerequisites

Instructions

Output

Error Handling

Examples

Resources

Similar Skills