Skill

anonymization-alternative

Evaluates anonymization as GDPR retention alternative under Recital 26 using WP29 techniques like randomization and generalization. Validates effectiveness with k-anonymity, l-diversity, t-closeness metrics.

security

data-engineering

npx claudepluginhub mukul975/privacy-data-protection-skills --plugin data-retention-skills

Tool Access

This skill uses the workspace's default tool permissions.

Preview

Anonymization transforms personal data into a form that no longer identifies or can reasonably be used to identify a natural person. Under GDPR Recital 26, truly anonymized data falls outside the scope of the regulation, meaning it can be retained indefinitely without a legal basis, without data subject rights applying, and without counting toward retention period obligations. However, achievin...

Supporting Assets

assets/template.mdreferences/standards.mdreferences/workflows.mdscripts/process.py

SKILL.md

Similar Skills

github-deep-research

63.9k

Conducts multi-round deep research on GitHub repos via API and web searches, generating markdown reports with executive summaries, timelines, metrics, and Mermaid diagrams.

2 files

bytedance-deer-flow-1

surprise-me

63.9k

Dynamically discovers and combines enabled skills into cohesive, unexpected delightful experiences like interactive HTML or themed artifacts. Activates on 'surprise me', inspiration, or boredom cues.

bytedance-deer-flow-1

image-generation

63.9k

Generates images from structured JSON prompts via Python script execution. Supports reference images and aspect ratios for characters, scenes, products, visuals.

2 files

bytedance-deer-flow-1

Stats

Parent Repo Stars37

Parent Repo Forks4

Last CommitMar 15, 2026

Used By2 plugins

Actions

View Source View Plugin View on GitHub View README

Characteristic	Anonymization	Pseudonymization
GDPR status	Outside GDPR scope (Recital 26)	Still personal data (Art. 4(5))
Reversibility	Irreversible — no means to re-identify	Reversible — additional information can re-identify
Retention	Can be retained indefinitely	Subject to retention schedule
Data subject rights	Do not apply	Fully apply
Legal basis	Not required	Required
Risk of failure	If anonymization is broken, data reverts to personal data status retroactively	N/A — always personal data
Technique	Randomization, generalization, suppression, data masking (irreversible)	Tokenization, encryption, key-based substitution (reversible)

Method	Description	Singling Out	Linkability	Inference	Suitability
Noise addition	Add random noise to numerical values (e.g., age ± 3 years, salary ± 5%)	Partially mitigates	Partially mitigates	Mitigates	Statistical analysis where exact values are not critical
Permutation	Shuffle attribute values within a dataset so that values are no longer linked to the correct record	Partially mitigates	Mitigates	Partially mitigates	Datasets where attribute distributions must be preserved but linkages broken
Differential privacy	Add calibrated noise to query results ensuring that the inclusion/exclusion of any single record does not significantly change the output	Mitigates	Mitigates	Mitigates	Aggregate analytics, machine learning training data

Method	Description	Singling Out	Linkability	Inference	Suitability
Aggregation	Replace individual values with aggregate statistics (mean, median, count)	Mitigates	Mitigates	Partially mitigates	Reporting, trend analysis
K-anonymity	Ensure that each combination of quasi-identifiers appears in at least k records	Mitigates (if k sufficiently large)	Partially mitigates	Does not mitigate	Releasing microdata for research
L-diversity	Ensure that within each equivalence class (k-anonymity group), there are at least l distinct values for sensitive attributes	Mitigates	Partially mitigates	Partially mitigates	Datasets with sensitive attributes
T-closeness	Ensure that the distribution of sensitive attributes within each equivalence class is close to the overall distribution (distance ≤ t)	Mitigates	Partially mitigates	Mitigates	Datasets where attribute distribution is sensitive
Top/bottom coding	Replace extreme values with threshold values (e.g., age >90 becomes "90+")	Partially mitigates	Partially mitigates	Partially mitigates	Protecting outliers in numerical data
Data masking	Irreversibly replace characters (e.g., postcode "SW1A 1AA" → "SW1A ***")	Mitigates (for masked fields)	Partially mitigates	Partially mitigates	Reducing granularity of quasi-identifiers

Method	Description	Effectiveness
Record suppression	Remove entire records that are unique or quasi-unique	Eliminates singling out for suppressed records
Attribute suppression	Remove entire columns that serve as identifiers or quasi-identifiers	Eliminates linkability via suppressed attributes
Cell suppression	Replace specific cell values with null where those values contribute to re-identification risk	Targeted mitigation of singling out

Data Type	Recommended Primary Technique	Secondary Technique	Validation Method
Structured numerical (age, salary, amounts)	Generalization (aggregation) + noise addition	Top/bottom coding for outliers	K-anonymity (k ≥ 5)
Structured categorical (gender, region, job title)	Generalization (hierarchy-based) + suppression of rare values	Permutation	L-diversity (l ≥ 3)
Free text (support tickets, notes)	Full suppression of personal identifiers + generalization of quasi-identifiers	Named entity removal + text generalization	Manual review sample + automated NER validation
Transactional (purchase history, usage logs)	Aggregation to cohort level + noise addition	Temporal generalization (day → week → month)	T-closeness (t ≤ 0.15) + k-anonymity (k ≥ 10)
Location data	Spatial generalization (precise coordinates → region/city)	Cloaking (minimum area containing k individuals)	K-anonymity (k ≥ 20 for location)

Test	Method	Threshold	Action if Failed
Singling out	Attempt to identify unique records using all available quasi-identifiers	< 0.05 (5%) probability of singling out any individual	Increase k-anonymity parameter; suppress unique records
Linkability	Cross-reference anonymized dataset with available external datasets (e.g., public records, social media)	No successful linkage in test sample (n ≥ 100)	Remove additional quasi-identifiers; increase generalization
Inference	Attempt to infer sensitive attribute values from quasi-identifiers within equivalence classes	No attribute can be inferred with > 80% confidence	Increase l-diversity; apply t-closeness
Motivated intruder test (ICO)	Simulate an attack by a motivated individual with access to public resources	Intruder cannot identify any individual with reasonable effort	Strengthen technique parameters; consider full suppression

Dataset Size	Minimum k	Rationale
< 1,000 records	k ≥ 10	Small datasets are more vulnerable to singling out
1,000 — 100,000 records	k ≥ 5	Standard protection level
> 100,000 records	k ≥ 3 (minimum); k ≥ 5 (recommended)	Larger datasets provide inherent protection
Special category data (any size)	k ≥ 10	Elevated risk from re-identification of sensitive data
Location data (any size)	k ≥ 20	Location data is highly re-identifiable (Montjoye et al., 2013: 4 spatiotemporal points sufficient to uniquely identify 95% of individuals)

anonymization-alternative

Tool Access

Preview

Supporting Assets

SKILL.md

Similar Skills

anonymization-alternative

Tool Access

Preview

Supporting Assets

SKILL.md

Anonymization as Retention Alternative

Overview

Legal Foundation

GDPR Recital 26 — Anonymized Data Outside GDPR Scope

Article 29 Working Party Opinion 05/2014 on Anonymization Techniques (WP216)

ICO Anonymization Code of Practice (Updated Guidance)

Anonymization vs. Pseudonymization

WP29 Anonymization Techniques

Technique 1: Randomization

Technique 2: Generalization

Technique 3: Suppression

Anonymization Assessment Workflow

Step 1: Determine Whether Anonymization is Appropriate

Step 2: Select Anonymization Technique

Step 3: Implement Anonymization

Step 4: Validate Anonymization Effectiveness

Re-Identification Risk Assessment

K-Anonymity Validation Criteria

Anonymization Register

Ongoing Monitoring

Annual Re-Identification Risk Review

Similar Skills

Anonymization as Retention Alternative

Overview

Legal Foundation

GDPR Recital 26 — Anonymized Data Outside GDPR Scope

Article 29 Working Party Opinion 05/2014 on Anonymization Techniques (WP216)

ICO Anonymization Code of Practice (Updated Guidance)

Anonymization vs. Pseudonymization

WP29 Anonymization Techniques

Technique 1: Randomization

Technique 2: Generalization

Technique 3: Suppression

Anonymization Assessment Workflow

Step 1: Determine Whether Anonymization is Appropriate

Step 2: Select Anonymization Technique

Step 3: Implement Anonymization

Step 4: Validate Anonymization Effectiveness

Re-Identification Risk Assessment

K-Anonymity Validation Criteria

Anonymization Register

Ongoing Monitoring

Annual Re-Identification Risk Review