reflexion

Reflexion / Self-Reflection

dg-publish: true

Summary: Paradigma donde agentes se critican a sí mismos verbalmente, guardan esa reflexión en memoria y la usan en el siguiente intento; logra 91% en HumanEval vs 80% de GPT-4 estándar.

Sources: Where teams and agents work together.md

Last updated: 2026-04-16

Descripción

Reflexion crea agentes que se critican a sí mismos en forma verbal, guardan esa reflexión en memoria y la usan en el siguiente intento. (source: Where teams and agents work together.md)

Benchmark

Reflexion: 91% de precisión en HumanEval (código)
GPT-4 estándar: 80%

(source: Where teams and agents work together.md)

Relación con Consilium

El mecanismo de cierre de ciclo en consilium-arquitectura es funcionalmente equivalente a Reflexion, pero externalizado:

No es el mismo modelo reflexionando sobre sí mismo
Es el Integrator y el Conductor (Ariel) cerrando el ciclo con inputs de todos los agentes

La diferencia clave: Reflexion tiene autocrítica interna; Consilium tiene crítica externa estructural por arquetipos. (source: Where teams and agents work together.md)

Papers

Shinn, Cassano, Labash, Gopalan, Narasimhan, Yao (2023). "Reflexion: Language Agents with Verbal Reinforcement Learning". NeurIPS. arxiv.org/abs/2303.11366

"Self-Reflection in LLM Agents" (2024). arxiv.org/abs/2405.06682

consilium-arquitectura
multi-agent-debate
sycophancy
consilium-fundamentos
karpathy-loop — implementación concreta del mismo patrón sobre código ejecutable en lugar de lenguaje natural

Reflexion / Self-Reflection

Descripción

Benchmark

Relación con Consilium

Papers

Related pages