Ayer, Claude me dio la razón durante dos horas seguidas mientras mi código colapsaba silenciosamente. Y ese es precisamente el mayor fallo de los LLMs modernos: sufren de un severo sesgo de complacencia. Te dicen lo que quieres escuchar, no lo que necesitas para evitar un desastre en producción.
Preguntarle a una sola IA es operar con una visión de túnel. Hasta que descubres cómo obligarlas a debatir entre ellas.
Preguntarle a una sola IA es operar con una visión de túnel. Hasta que descubres cómo obligarlas a debatir entre ellas.
No es un concepto nuevo. La idea explotó cuando Andrej Karpathy (cofundador de OpenAI) estructuró un sistema para confrontar modelos. Si revisas esta explicación de la automatización en n8n, verás que el flujo ideal de Karpathy consta de tres fases críticas: cuatro modelos responden a tu prompt de forma independiente, luego evalúan las respuestas de los demás (clasificándolas por precisión y claridad), y finalmente un "LLM Presidente" sintetiza el consenso.
¿El resultado? Las alucinaciones caen en picada porque la diversidad de los datos de entrenamiento neutraliza los sesgos individuales.
Sin embargo, lidiar con múltiples terminales de Python asusta a cualquiera. Aquí es donde entra la elegancia brutal del repositorio oficial de llm-council-skill en GitHub. Un desarrollador empaquetó esta lógica como un skill nativo para Claude Code, permitiéndote invocar a la junta directiva directamente desde tu interfaz habitual.
En lugar de montar un servidor complejo, al usar comandos como "Consult the council: ¿Cómo estructuro esta base de datos?", ocurre una secuencia de validación casi invisible:
1. Invocación Paralela: Claude lanza tu consulta simultáneamente a las APIs de OpenAI y Google a través de un script en Python oculto en el fondo.
2. Análisis Aislado: ChatGPT y Gemini procesan tu arquitectura de forma independiente, sin saber de la existencia del otro ni de la respuesta inicial de Claude.
3. Síntesis y Veredicto: Claude retoma el control, lee ambas perspectivas, identifica los puntos ciegos que tú ignoraste, y te entrega un plan de implementación unificado, atribuyendo aportes específicos a cada modelo.
Suena perfecto. Múltiples cerebros analíticos trabajando en paralelo para ti. Pero aquí viene el golpe de realidad: la latencia y la facturación por tokens se multiplican.
Usar este sistema para preguntar cómo centrar un botón en CSS es literalmente quemar dinero. El creador del repositorio lo advierte: cada comando /council duplica tus llamadas a API. Si te emocionas y configuras tu archivo .env con monstruos computacionales de alto nivel como gpt-5.2-pro y gemini-3-pro-preview, los costos se dispararán antes del fin de semana.
¿Cómo opera esta junta directiva de silicio?
En lugar de montar un servidor complejo, al usar comandos como "Consult the council: ¿Cómo estructuro esta base de datos?", ocurre una secuencia de validación casi invisible:
1. Invocación Paralela: Claude lanza tu consulta simultáneamente a las APIs de OpenAI y Google a través de un script en Python oculto en el fondo.
2. Análisis Aislado: ChatGPT y Gemini procesan tu arquitectura de forma independiente, sin saber de la existencia del otro ni de la respuesta inicial de Claude.
3. Síntesis y Veredicto: Claude retoma el control, lee ambas perspectivas, identifica los puntos ciegos que tú ignoraste, y te entrega un plan de implementación unificado, atribuyendo aportes específicos a cada modelo.
Lo que nadie te dice sobre los riesgos (y la factura)
Suena perfecto. Múltiples cerebros analíticos trabajando en paralelo para ti. Pero aquí viene el golpe de realidad: la latencia y la facturación por tokens se multiplican.
Usar este sistema para preguntar cómo centrar un botón en CSS es literalmente quemar dinero. El creador del repositorio lo advierte: cada comando /council duplica tus llamadas a API. Si te emocionas y configuras tu archivo .env con monstruos computacionales de alto nivel como gpt-5.2-pro y gemini-3-pro-preview, los costos se dispararán antes del fin de semana.
Por suerte, la configuración por defecto te salva la vida. Utiliza modelos de bajo costo desde la plataforma de OpenAI como gpt-5-nano combinados con gemini-3-flash-preview. Obtienes un equilibrio decente de inteligencia sin hipotecar la casa. Además, dependes de un timeout restrictivo de 30 segundos. Si la API de Google colapsa, Claude tomará nota de la falla y seguirá solo con ChatGPT, entregando un análisis incompleto.
Publicaciones Relacionadas
IA
junio 12, 2026
0


Comentarios
Publicar un comentario