meta-consilium-loop

Meta-Consilium Loop

Summary: Propuesta de diseño que aplica el patrón del karpathy-loop al diseño autónomo de equipos de Consilium — team-spec como superficie editable, eval harness determinista como métrica, ratchet loop como motor de mejora continua sin intervención humana.

Sources: Meta-Consilium loop para mejorar equipos sin interaccion humana.md

Last updated: 2026-04-18

Nota: Este es un documento de diseño interno, no investigación empírica verificada. Las fuentes académicas citadas (Karpathy, Reflexion, ToT, GoT) están verificadas en otras páginas. Las conclusiones operativas son hipótesis de diseño pendientes de validación experimental.


Hipótesis central

El karpathy-loop demostró que un agente puede mejorar código de entrenamiento autónomamente con tres condiciones: superficie editable única, métrica clara, presupuesto de tiempo fijo. La misma lógica aplica al diseño de equipos de consilium-arquitectura: si el team-spec es la superficie editable y el eval harness es la métrica, el loop puede optimizar equipos sin humano en el ciclo.

Los 7 componentes operativos

1. Superficie editable única por equipo (team-spec)

Un archivo por equipo — team-spec.md o team-config.yaml — que contiene:

Todo cambio versionado. Análogo a train.py en AutoResearch.

2. Evaluation Harness determinista

Cada corrida produce 4 scores reproducibles:

Score Qué mide
score_principal Calidad de la decisión final
guardrail_1 Contradicciones internas
guardrail_2 Costo (tokens / latencia)
guardrail_3 Trazabilidad (acuerdos, supuestos, riesgos, tareas)

Sin harness determinista, no hay mejora confiable. Ver evals para diseño de métricas.

3. Banco de casos con holdout

Dataset por dominio con:

4. Oráculo de evaluación 100% automático

Combina tres capas:

  1. Validador por reglas (estructura, cobertura, consistencia)
  2. Jury de 2-3 jueces LLM con rúbrica fija
  3. Penalización por desacuerdo entre jueces

La combinación reduce el sesgo individual de LLM-as-judge. Ver evals — tipos de evaluación.

5. Loop ratchet (sin humano)

Ciclo autónomo:

  1. Proponer variante de team-spec
  2. Ejecutar suite completa de casos
  3. Comparar contra baseline
  4. Promover solo si mejora score Y respeta guardrails
  5. Si no mejora, descartar

Principio fundamental: nunca degradar baseline. Mismo principio que AutoResearch de Karpathy.

6. Protecciones anti-gaming

7. Despliegue autónomo seguro

Meta-Consilium como fábrica de equipos

Pipeline para generar equipos nuevos para un cliente:

  1. Clasificar problema del cliente por dominio/vertical
  2. Generar 3-5 configuraciones candidatas de equipo
  3. Evaluar automáticamente sobre benchmark del vertical
  4. Seleccionar mejor variante por score compuesto
  5. Empaquetar team-spec reutilizable

Núcleo estable: 5 roles base (ver consilium-arquetipos).
Specialist: activar solo si dominio regulado o alto costo de error.

Conecta directamente con consilium-giro-estrategico: el giro a equipos personalizados entregados como packs se vuelve automatizable con Meta-Consilium.

Relación con scaffolding-engineering

Meta-Consilium es una instancia específica de Scaffolding Engineering aplicada a Consilium. Donde AutoAgent de ThirdLayer optimiza el harness de un agente genérico, Meta-Consilium optimiza la configuración de un equipo multi-agente estructurado con roles fijos.

Diferencia clave: Meta-Consilium tiene restricciones adicionales (roles no son arbitrarios — Critic, Architect, etc. tienen funciones cognitivas definidas). El optimizador ajusta prompts y parámetros dentro de esa estructura, no los roles mismos.

Preguntas de investigación abiertas

Estas preguntas no tienen respuesta en el documento fuente — son líneas de investigación pendientes:

  1. ¿Qué métricas predicen mejor valor real de negocio en equipos multi-agente?
  2. ¿Cómo detectar automáticamente sycophancy residual en equipos con Critic?
  3. ¿Qué configuración minimiza costo sin perder calidad por vertical?
  4. ¿Cómo diseñar evals robustos cuando no hay ground truth único?
  5. ¿Qué tan transferibles son mejoras entre dominios distintos?
Powered by Forestry.md