Skill

audit-model-fairness

Measures ML model performance across demographic groups to detect discriminatory outcomes. Required for regulatory compliance (EU AI Act, CFPB, EEOC) and ethical AI deployment.

ai-ml

npx claudepluginhub jeffreytse/grimoire --plugin grimoire

Popularity

Stars

Forks

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/grimoire:audit-model-fairness

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

Systematically measure and document a model's performance across demographic groups to identify discriminatory outcomes before or after deployment.

SKILL.md

61 lines · ~1.5k tokens

Similar Skills

validating-ai-ethics-and-fairness

2.2k

Validates AI/ML models and datasets for bias, fairness using Fairlearn/AIF360 metrics, four-fifths rule, severity classification, and ethics mapping.

9 files6 tools

ai-ethics-validator

s4h-ethics-bias-check

133

Audits algorithms, models, ranking systems, and automated decisions for discriminatory patterns and unfair outcomes. Use before deploying any system that makes decisions about people.

skills-for-humanity

ai-ethics-review

946

Conducts a structured ethical review of AI/ML features, models, or products covering fairness, transparency, privacy, safety, accountability, and societal impact with risk scoring and mitigations.

pm-advanced

Stats

LanguageShell

Stars12

Forks1

MaintenanceExcellent

Last CommitJun 11, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

Stats

Actions

Help us improve

Share bugs, ideas, or general feedback.

Audit Model Fairness

Systematically measure and document a model's performance across demographic groups to identify discriminatory outcomes before or after deployment.

Why This Is Best Practice

Adopted by: Required by EU AI Act (2024) for high-risk AI systems; CFPB fair lending requirements; EEOC guidelines for employment AI; NIST AI RMF adopted by US federal agencies Impact: Biased models create legal liability (CFPB fines up to $1M/day for fair lending violations); Amazon famously retracted an AI hiring tool after discovering gender bias; proactive audits prevent reputational and regulatory harm Why best: Models trained on historical data encode historical discrimination; without measurement, unfairness is invisible until harm occurs

Sources: NIST AI RMF 1.0 (2023); Barocas, Hardt & Narayanan "Fairness and Machine Learning" (2019); IEEE Ethically Aligned Design v2 (2019)

Steps

Define the protected attributes — Identify legally and ethically relevant attributes for your context: race, gender, age, disability status, national origin, religion, sexual orientation. Determine which you can directly measure and which must be inferred from proxies. Document legal basis and jurisdiction.
Select fairness metrics — Choose metrics appropriate to the decision context. Demographic parity: equal positive prediction rates across groups (appropriate for representation goals). Equalized odds: equal TPR and FPR across groups (appropriate for classification). Calibration: equal prediction accuracy across groups (appropriate for risk scoring). No single metric satisfies all simultaneously (impossibility theorem); choose based on harm type.
Assemble a stratified evaluation dataset — Evaluation data must be representative of the deployment population. Oversample minority groups to ensure statistical significance (minimum 100 samples per subgroup for meaningful metrics). Use held-out data, not training data. Document dataset construction methodology.
Measure overall model performance — Establish baseline accuracy, precision, recall, and AUC for the full population. This is the reference point for group-level comparisons. Document evaluation date and model version.
Measure per-group performance — Compute the same performance metrics for every protected group. Calculate disparity ratios: group metric / majority group metric. Flag disparities above 0.8 (80% rule, EEOC 4/5ths rule) as potential adverse impact. Visualize as a fairness dashboard.
Investigate sources of disparity — Analyze: Is disparity in the training data (historical bias)? In feature selection (proxy discrimination)? In model architecture? In label quality (human labeling bias)? Use SHAP values to identify which features drive differential predictions across groups.
Apply mitigation techniques — Pre-processing: reweight training data, resample underrepresented groups. In-processing: add fairness constraints to the loss function (adversarial debiasing, regularization). Post-processing: adjust decision thresholds per group to equalize error rates. Document trade-offs with overall model performance.
Conduct human review of edge cases — Sample 50-100 misclassified cases per protected group. Have domain experts review for patterns. Automated metrics miss contextual harms that human review surfaces (e.g., stereotyped language in text models).
Produce a model card or fairness audit report — Document: model purpose, intended use, evaluation methodology, per-group performance metrics, known limitations, and mitigation steps taken. Publish internally and externally per your disclosure policy. EU AI Act requires this for high-risk systems.
Establish ongoing monitoring — Deploy fairness monitoring in production. Track per-group prediction distributions monthly. Set alerts if demographic disparity increases above threshold post-deployment. Retrain or retune when drift is detected. Fairness is not a one-time audit.

Rules

No model affecting consequential decisions (employment, credit, healthcare) should be deployed without a completed fairness audit.
Fairness and accuracy are often in tension; document the trade-off explicitly and let stakeholders make the decision — do not hide it.
Never use protected attributes as model features in jurisdictions where this is prohibited by law; proxy variables (zip code as income proxy) can have equivalent discriminatory effect.
Consult legal counsel before publishing fairness audit results; findings may create legal exposure and require qualified communication.

Common Mistakes

Measuring only aggregate accuracy — a model with 90% accuracy may have 95% accuracy for one group and 75% for another; aggregate metrics obscure group-level harm.
Selecting fairness metrics after seeing results — choose metrics before analysis; post-hoc selection biases toward favorable metrics.
Treating a one-time audit as sufficient — distribution shift in production data causes fairness properties to degrade; only ongoing monitoring detects this.
Conflating correlation with causation — a model performs worse for a group because of data or feature issues, not because the group is inherently harder to predict.

When NOT to Use

Models with no human impact (weather prediction, scientific simulation, internal analytics without decision-making use)
Contexts where protected attribute data is legally prohibited from collection and proxy analysis is not feasible

audit-model-fairness

Popularity

Invocation

Context Preview

SKILL.md

Similar Skills

Help us improve

Help us improve

Find plugins for your project

audit-model-fairness

Popularity

Invocation

Context Preview

SKILL.md

Audit Model Fairness

Why This Is Best Practice

Steps

Rules

Common Mistakes

When NOT to Use

Similar Skills

Help us improve

Audit Model Fairness

Why This Is Best Practice

Steps

Rules

Common Mistakes

When NOT to Use