Lo interesante está en los logs
Escribo sobre tecnología. A veces funciona.
-
El dilema del silicio
¿Son buenos o malos los modelos de lenguaje por naturaleza? Para averiguarlo, los sometí al dilema del prisionero, al póker y al Gran Consejo Galáctico. Lo que descubrí dice algo sobre ellos y bastante sobre nosotros.
-
¿En qué idioma piensan los LLMs?
¿Cómo pueden los modelos de lenguaje hablar finés, chino o incluso klingon? ¿Podemos saber en qué idioma piensan los LLM.
-
Disonancias cognitivas en modelos empáticos
Sectas que esperan ovnis, modelos que se enredan con un elefante, y un espejo que nos da siempre la razón. Una historia sobre posibles casos de disonancia cognitiva en los llms.
-
Autopsia de una alucinación
¿Por qué fallan los prompts? Un recorrido por self-critique, logprobs, incertidumbre semántica e interpretabilidad para hacerle la autopsia a una alucinación.
-
MAD: Multi-Agent Debate
Qué es Multi-Agent Debate (MAD), por qué puede reducir sesgos y alucinaciones en LLMs, y cómo implementar un debate entre agentes con LangGraph, roles, rondas y moderador.
-
Consideraciones epistemológicas en los espacios latentes
Una guía divulgativa para entender los espacios latentes de los LLMs, cómo aprenden los Transformers y por qué conviene hablar bien a la inteligencia artificial.
-
Introducción al context engineering
Los LLMs no mejoran solo con modelos más grandes: el verdadero reto está en qué contexto reciben, cómo lo recuerdan y cómo se organiza.
-
CrewAI avanzado 01
Tutorial avanzado de CrewAI en Python: cómo definir agentes con roles, herramientas personalizadas, proceso jerárquico, salidas estructuradas con Pydantic, guardrails y kickoff asíncrono.
-
La LLM Wiki de Andrej Karpathy
Cómo montar una LLM Wiki personal con Claude Code y Obsidian: la técnica de Andrej Karpathy para compilar conocimiento en Markdown que el modelo usa como contexto en lugar de buscar desde cero.
-
Agent to Agent
Guía del protocolo A2A (Agent-to-Agent) de Google: Agent Card, JSON-RPC, Tasks, Artifacts, streaming, webhooks y autenticación. Todo lo que necesitas saber antes de usar el SDK.