Skill

reflexion-pattern

Reflexion (verbal reinforcement learning) pattern library — implementation of the Reflexion paradigm by Shinn et al. 2023 (Reflexion: Language Agents with Verbal Reinforcement Learning, NeurIPS 2023) where an LLM agent improves iteratively by reflecting on its own failures in natural language and storing those reflections in a memory buffer for the next attempt. Covers the core Reflexion architecture (Actor that generates trajectories, Evaluator that scores outcomes binary or scalar, Self-Reflection module that converts failures into verbal lessons, Memory buffer that persists reflections across trials), the trial loop (Generate trajectory → Evaluate → Reflect → Store → Retry with reflections in context), comparison with classical RL (verbal feedback instead of gradient updates, no model weight changes, instant feedback loop), comparison with self-correction (Reflexion uses persistent memory across trials, simple self-correction is single-shot), benchmark gains reported in the paper (HumanEval coding 91% vs 80% baseline, AlfWorld decision-making 85% vs 75%, HotPotQA QA 56% vs 50%), implementation strategies (binary reward vs scalar reward, reflection prompt design, memory consolidation when buffer fills, max trials limit), use cases where Reflexion excels (coding tasks with test feedback, multi-step tool use with eval signal, agentic workflows with success/failure outcomes), use cases where it fails (no clear success signal, single-turn tasks, creative tasks without ground truth), production frameworks (LangChain Reflexion templates, custom implementations on top of any agent framework), evaluation methodology (track improvement curve across trials, measure reflection quality, detect divergence), and the limitations (cost multiplied by N trials, latency, divergence risk, context overflow as memory grows). Use when an agent fails on tasks but has access to feedback signal, when iterative refinement could help, or when classical fine-tuning is too expensive. Differentiates from CoT or ReAct (single-pass reasoning) by explicit multi-trial loop with verbal memory.

Install

npx claudepluginhub arnwaldn/atum-plugins-collection --plugin atum-ai-ml

Tool Access

This skill uses the workspace's default tool permissions.

Preview

Pattern publié par **Shinn et al. 2023** (Northeastern + MIT, NeurIPS 2023). "Reflexion: Language Agents with Verbal Reinforcement Learning" propose une alternative à RLHF où un agent LLM apprend de ses erreurs **sans modifier les poids du modèle**, juste en stockant des réflexions verbales dans sa mémoire entre essais.

SKILL.md

Similar Skills

subagent-driven-development

3 files

Executes implementation plans in current session by dispatching fresh subagents per independent task, with two-stage reviews: spec compliance then code quality.

superpowers

150.3k

receiving-code-review

Processes code review feedback technically: verify suggestions against codebase, clarify unclear items, push back if questionable, implement after evaluation—not blind agreement.

superpowers

150.3k

requesting-code-review

1 file

Dispatches code-reviewer subagent to evaluate code changes via git SHAs after tasks, major features, or before merging, with focused context on implementation and requirements.

superpowers

150.3k

Stats

Parent Repo Stars0

Parent Repo Forks0

Last CommitApr 8, 2026

Actions

View Source View Plugin View on GitHub View README

Reflexion (Verbal Reinforcement Learning)

Pattern publié par Shinn et al. 2023 (Northeastern + MIT, NeurIPS 2023). "Reflexion: Language Agents with Verbal Reinforcement Learning" propose une alternative à RLHF où un agent LLM apprend de ses erreurs sans modifier les poids du modèle, juste en stockant des réflexions verbales dans sa mémoire entre essais.

Le principe en 1 phrase

Au lieu d'entraîner le modèle (gradient descent sur des poids), on lui fait réfléchir verbalement sur ses échecs et on garde ces réflexions dans le contexte du prochain essai.

Architecture

┌─────────────────────────────────────────────────────────────┐
│                       REFLEXION LOOP                         │
└─────────────────────────────────────────────────────────────┘

[TASK]
   │
   ▼
┌─────────┐
│  ACTOR  │ ◄────── Memory[reflection_1, reflection_2, ...]
│  (LLM)  │
└────┬────┘
     │ trajectory + final answer
     ▼
┌──────────┐
│EVALUATOR │ → succès / échec (binary or scalar reward)
└────┬─────┘
     │
     ├─── ✅ succès → END
     │
     └─── ❌ échec
              │
              ▼
        ┌──────────────┐
        │ SELF-REFLECT │
        │   "Pourquoi  │
        │   ai-je      │
        │   échoué ?"  │
        └──────┬───────┘
               │
               ▼
        Store reflection
               │
               └──→ LOOP back to Actor (next trial)

Composants

1. Actor

Le LLM qui génère la trajectoire (action sequence ou solution). Reçoit la mémoire des réflexions précédentes.

2. Evaluator

Binary : test pass/fail (ex: HumanEval, AlfWorld goal reached)
Scalar : score continu (ex: BLEU, ROUGE, custom heuristic)
LLM-as-judge : un autre LLM évalue (Reflexion + LLM eval = combinable)

3. Self-Reflection module

Prompt LLM qui transforme la trajectoire échouée en leçon verbale exploitable :

Tu viens d'échouer la tâche X. Voici ce que tu as fait :
{trajectory}

Voici le résultat : {result}
Voici l'erreur : {error}

Analyse pourquoi tu as échoué et formule une leçon courte (2-3 phrases)
qui t'aidera à réussir au prochain essai. Sois spécifique.

4. Memory buffer

Stocke les réflexions des essais précédents. Injecté dans le prompt de l'Actor au prochain trial.

Pseudo-code

def reflexion_loop(task, max_trials=5):
    memory = []  # liste de réflexions
    for trial in range(max_trials):
        # Actor génère
        prompt = build_actor_prompt(task, memory)
        trajectory = actor_llm(prompt)

        # Evaluator score
        result, error = evaluator(trajectory, task)
        if result == "SUCCESS":
            return trajectory  # done

        # Self-reflection
        reflection_prompt = build_reflection_prompt(task, trajectory, error)
        reflection = llm_call(reflection_prompt)
        memory.append(reflection)

        # Memory consolidation if buffer too long
        if len(memory) > 10:
            memory = consolidate_memory(memory)  # LLM résume

    return None  # failed after max_trials

Exemple : HumanEval coding (du papier)

Trial 1:
Task: Write a function that returns the sum of all even numbers in a list.
Code:
def sum_even(lst):
    return sum(x for x in lst if x % 2 == 1)  # BUG: x % 2 == 1 vise les impairs
Test: FAIL — input [1,2,3,4] expected 6 got 4

Reflection 1: J'ai confondu pairs et impairs. `x % 2 == 0` filtre les pairs,
              pas `x % 2 == 1`. Vérifier la condition au prochain essai.

Trial 2:
[Memory: Reflection 1]
Code:
def sum_even(lst):
    return sum(x for x in lst if x % 2 == 0)
Test: PASS ✓

Gains mesurés (papier)

Benchmark	Baseline	Reflexion	Gain
HumanEval (Python coding)	80.1%	91.0%	+11 pts
HumanEval+ (harder tests)	67.7%	77.4%	+10 pts
AlfWorld (decision-making)	75%	85%	+10 pts
HotPotQA (multi-hop QA)	50%	56%	+6 pts

Pour beaucoup de tâches : +45% de qualité moyenne après 2-3 itérations.

Reflexion vs alternatives

Pattern	Différence
CoT seul	Single-pass, pas d'apprentissage entre essais
Self-Consistency	N essais en parallèle indépendants, pas de mémoire
Self-correction simple	1 retry sans mémoire persistante
Self-refine (Madaan et al.)	Refinement iteratif sans evaluator binaire — bon pour creative writing
Reflexion	Multi-trial avec mémoire verbale persistante, evaluator obligatoire
RLHF / DPO	Modifie les poids du modèle — coûteux, pas instant

Quand utiliser Reflexion

✅ Bons cas :

Tâches avec signal de succès clair (tests, ground truth, eval déterministe)
Coding avec tests automatiques (HumanEval, LeetCode, debugging)
Multi-step tool use où le résultat final peut être validé
Agentic workflows (AlfWorld, WebArena) avec goal explicit
Math avec vérification de solution

❌ Mauvais cas :

Pas de signal de succès → impossible d'évaluer
Tâches single-turn (Q&A factuel)
Tâches créatives sans ground truth (poésie, fiction)
Latence critique (<1s) — Reflexion implique N trials

Implémentation production

Frameworks

LangChain : langchain.experimental.cpal pour Reflexion-like loops
DSPy : dspy.Refine est conceptuellement proche
Custom : implementation directe est souvent simple (~100 lignes)

Considérations

Coût multiplié : 1 trial → N trials = N × coût
Latence : N appels séquentiels (sauf si batchable)
Memory growth : consolider le buffer après ~10 réflexions
Divergence : monitorer la qualité — si trial N est pire que N-1, stop
Cache : cacher les évaluations pour réduire les coûts

Pattern de prompt Self-Reflection

You are analyzing your past attempts to learn from failures.

Task: {task_description}

Your last attempt:
{past_trajectory}

Outcome: FAILED
Reason: {evaluator_feedback}

Your previous reflections (lessons learned):
{previous_reflections}

Now write a concise reflection (2-3 sentences) on:
1. What went wrong this time
2. What specific strategy you should try differently
3. How to avoid this failure mode

Reflection:

Anti-patterns

Pas d'evaluator clair → Reflexion impossible, le loop diverge
Reflections trop longues → context overflow rapide
Pas de memory consolidation → buffer grandit indéfiniment
Pas de max_trials → coûts incontrôlés
Reflections génériques ("j'aurais dû mieux faire") → inutiles
Pas de cache d'évaluation → coûts inflates
Evaluator = même LLM sans context séparé → biais self-confirming
Utiliser pour tâches single-turn → overkill, CoT suffit
Pas de logging des trials → impossible de debug ou améliorer
Ignorer la divergence → trial N peut être pire que trial 1

Quand déléguer

Pattern d'agent ReAct simple → skill react-pattern (ce plugin)
Pattern multi-options → skill tree-of-thoughts (ce plugin)
Auto-correction RAG → skill corrective-rag (ce plugin)
Eval framework → skill eval-harness (ce plugin)
Implémentation d'un agent prod → agent prompt-engineer (ce plugin)

Ressources

Paper original : https://arxiv.org/abs/2303.11366
Code original : https://github.com/noahshinn/reflexion
Self-Refine (Madaan 2023, alternative) : https://arxiv.org/abs/2303.17651