reflexion
Reflexion / Self-Reflection
dg-publish: true
Summary: Paradigma donde agentes se critican a sí mismos verbalmente, guardan esa reflexión en memoria y la usan en el siguiente intento; logra 91% en HumanEval vs 80% de GPT-4 estándar.
Sources: Where teams and agents work together.md
Last updated: 2026-04-16
Descripción
Reflexion crea agentes que se critican a sí mismos en forma verbal, guardan esa reflexión en memoria y la usan en el siguiente intento. (source: Where teams and agents work together.md)
Benchmark
- Reflexion: 91% de precisión en HumanEval (código)
- GPT-4 estándar: 80%
(source: Where teams and agents work together.md)
Relación con Consilium
El mecanismo de cierre de ciclo en consilium-arquitectura es funcionalmente equivalente a Reflexion, pero externalizado:
- No es el mismo modelo reflexionando sobre sí mismo
- Es el Integrator y el Conductor (Ariel) cerrando el ciclo con inputs de todos los agentes
La diferencia clave: Reflexion tiene autocrítica interna; Consilium tiene crítica externa estructural por arquetipos. (source: Where teams and agents work together.md)
Papers
Shinn, Cassano, Labash, Gopalan, Narasimhan, Yao (2023). "Reflexion: Language Agents with Verbal Reinforcement Learning". NeurIPS. arxiv.org/abs/2303.11366
"Self-Reflection in LLM Agents" (2024). arxiv.org/abs/2405.06682