Últimos insights
21 may 2026
Usar IA para programar no es lo mismo que construir sistemas de IA
Programar asistido por IA se está volviendo el mínimo común. La ingeniería de sistemas de IA es el verdadero diferenciador. Aquí está la diferencia, y por qué importa.19 may 2026
El mapa de permisos que todo agente necesita antes de llamar tools
Los agentes con tools necesitan un mapa explícito de qué pueden leer, escribir, mutar, escalar y nunca tocar.12 may 2026
RAG no empieza con embeddings. Empieza con answerability.
Antes de afinar retrieval, prueba que la pregunta puede responderse desde el corpus, con una cita que un humano aceptaría.5 may 2026
El runbook de IA para las 3 a.m.
La IA en producción falla de formas que un runbook común no cubre. El plan operativo debe incluir drift de calidad, fallas de retrieval, caídas de modelo, picos de costo y escalación humana.28 abr 2026
Arquitectura de agentes consciente del cache, o por qué tu loop está pagando por el mismo contexto quince veces
El prompt cache dejó de ser una optimización de rendimiento. Es una restricción arquitectónica que decide si un agente de larga duración es operable o no.21 abr 2026
MCP se está convirtiendo en la interfaz de producción para agentes — opéralo como tal
El Model Context Protocol está pasando de ser una conveniencia para desarrolladores a la interfaz de producción entre los agentes y tus sistemas. Esto es lo que cambia cuando se trata así.14 abr 2026
Loops de agentes con verificador — la evaluación, movida de CI al runtime
Un modelo verificador pequeño entre el modelo frontier y la frontera de efectos colaterales es la pieza de arquitectura agentic más útil que casi nadie está enviando todavía.7 abr 2026
El modelo más barato que pasa la evaluación gana
Cómo una evaluación que funciona elige el modelo — y cuántas veces la respuesta no es el modelo frontier con el que llegó el equipo.31 mar 2026
No hacemos PoCs huérfanas: un usuario real entra al sistema en la semana 2
Una PoC sin camino a producción esconde las decisiones difíciles. Un usuario en semana 2 las fuerza a aparecer cuando la arquitectura todavía es barata de cambiar.24 mar 2026
Lo que un usuario real rompió el día doce y ninguna especificación habría detectado
Por qué metemos a un usuario real dentro del sistema en la semana 2, y qué decisiones de arquitectura se reescriben cuando lo hacemos.17 mar 2026
La evaluación que escribimos en la semana uno y mató al build en la semana dos
Cómo funciona la evaluación de discovery — incluyendo las dos veces que nos retiramos y devolvimos el fee.10 mar 2026
Marcos de evaluación que sobreviven al contacto con producción
Un arnés de evaluación es un producto. Envíalo como tal — versionado, con dueño y monitoreado.