Fábrica de software de IA · Los mismos tres ingenieros, en cada proyecto · 4 a 6 al año

Sistemas de IA en producción que tus ingenieros pueden operar. Construidos sobre una regla: escribir la evaluación antes del prompt.

La mayoría de los proyectos de IA sobreviven al demo y fallan en la primera semana real de operación. Nosotros entregamos sistemas que tu equipo de guardia puede operar a las 3 a. m., con un arnés de evaluación bajo control de tu equipo y probado por un usuario real en la semana 2, cuando la arquitectura todavía es barata de cambiar.

Agenda 30 minutos Inspecciona tres sistemas en vivo

Qué te llevas

Tres activos operativos bajo control de tu equipo antes del handover.

La mayoría de los proyectos terminan con un repo y una buena intención. Los nuestros terminan con tres cosas que tu equipo puede operar sin nosotros.

eval

La evaluación, antes del prompt

Cada build arranca con un dataset de evaluación y umbrales explícitos. Si no podemos escribir una evaluación defendible en los primeros 14 días, cancelamos el proyecto y te devolvemos el fee de discovery. Lo hemos hecho dos veces.

runbook

El runbook que tu equipo de guardia abre a las 3 a. m.

No la diapositiva con flechas. El documento concreto: alertas, escenarios de degradación, cuándo despertar a un humano, cómo hacer rollback. Lo entregamos firmado en la última semana.

IP, datos y la cuenta del modelo, a tu nombre — desde el día uno

Tu repo. Tus credenciales de OpenAI / Anthropic / AWS. Tus dashboards. Cuando entregamos, tu equipo no necesita pedirnos credenciales: ya son suyas y siempre lo fueron.

Lo que enviamos a producción

Tres sistemas en vivo que puedes inspeccionar, no casos de estudio sanitizados.

Microstax, BidGenie, DeOne — sistemas públicos de IA con decisiones de producto, tradeoffs y restricciones operativas visibles. Líderes de producto pueden inspeccionar las decisiones de flujo. Equipos técnicos pueden revisar restricciones, modos de falla y supuestos operativos.

Ver los tres →

BidGenie

Un flujo de trabajo con IA que convierte RFPs, DDQs y cuestionarios de seguridad en borradores revisables en horas, con aprobación humana en cada paso.

Primeros borradores en horas en vez de días · aprobación humana en cada punto crítico · nada generado por IA sale sin revisar

LangGraphOpenAINext.js

DeOne

Una plataforma de citas grounded en ciencia — evaluaciones psicométricas, matching multi-dimensional y un coach de IA que entiende ambos lados de la conversación.

50+ dimensiones de matching · coach de IA grounded en psicometría · detección de crisis incluida antes del lanzamiento

Next.jsOpenAIpgvector

Microstax

Un runtime de entornos nativo para agentes — sandboxes de Kubernetes aislados y gobernados para desarrolladores humanos y agentes de IA autónomos.

Spin-up < 60 s · 8+ horas ahorradas por dev por semana · onboarding de 2 semanas a 1 día

KubernetesLangGraphGitHub Actions

Cómo trabajamos

Cuatro reglas operativas.

Cada una ha cerrado una conversación comercial. Cada una ha protegido una entrega.

01
Evaluación antes que prompt. Siempre.
La mayoría escribe el prompt primero. Si parece bien, lo envían. Nosotros no. Escribimos el set de evaluación primero — preguntas reales, respuestas reales, umbrales reales. Esa evaluación decide si un cambio se mergea. Sin evaluación verde, sin merge. El equipo termina dueño de la decisión, no de nuestra opinión.
02
No hacemos PoCs huérfanas. Un usuario real entra al sistema en la semana 2.
Una PoC sin camino a producción suele esconder las decisiones difíciles. Elegimos a un usuario real (habitualmente alguien de tu equipo) y le ponemos en la mano lo que tenemos hasta ese momento. Lo que aprendemos en la semana 2 cambia lo que entregamos en la semana 8. Las decisiones de arquitectura se toman contra una transcripción, no solo en una pizarra.
03
El modelo más barato que pasa la evaluación gana.
Calidad, latencia y costo se evalúan juntos. Frontier cuando es necesario; modelo más pequeño cuando no. Esa decisión la toma la evaluación, no la relación con un proveedor. En builds recientes, las rutas de producción que no necesitaban razonamiento frontier quedaron por debajo de $0.50 / 1M tokens — un recorte del 80%+ frente a un build que va a frontier por defecto. La diferencia no es solo costo: es latencia, throughput y la libertad de re-evaluar cuando el problema cambie.
04
Cero bait-and-switch. El mismo trío principal de principio a fin.
Pagas por ejecución de nivel senior, no por capacitación de juniors. El mismo trío—arquitecto, ingeniero y diseñador—que define tu sistema escribe el código, las evaluaciones y los runbooks. Limitamos nuestros proyectos para proteger este enfoque.

La aritmética

La aritmética. Publicada para que el fit sea claro antes de invertir tiempo técnico.

Tarifa fija o tiempo y materiales, según el riesgo. Te decimos qué modelo proponemos en la primera llamada y por qué.

Discovery + evaluación: desde $8k · 1–2 semanas
Build (pequeño): $40–80k · 6–8 semanas
Build (mediano): $80–160k · 10–14 semanas
Auditoría / revisión: $15–25k · 3 semanas · precio fijo

Publicamos los precios porque los rangos opacos consumen ciclos de compras antes de que el fit técnico esté claro. Si estos rangos encajan con tu presupuesto, hablaremos de ingeniería en la primera llamada, no de diapositivas de venta.

A qué decimos no

Decimos no cuando no podemos defender el resultado.

Ejemplos concretos del último año:

"RAG sobre todos nuestros documentos." No hay pregunta concreta, no hay evaluación posible.
Pruebas de concepto sin planes de despliegue en producción. Diseñamos código para ser operado, no prototipos para ser archivados.
Un agente que reemplace a humanos en decisiones legales, médicas o financieras.
Proyectos donde el criterio de éxito es "lo sabremos cuando lo veamos."
Proyectos donde el prompt se trata como el producto y la operación queda para después.

Si tu proyecto cae fuera de nuestro enfoque, te presentaremos a los equipos más adecuados para ese camino. Esa introducción siempre es gratuita.

Las tres formas

Apps agenticas y herramientas de IA, construidas para producción

Diseñamos y enviamos workflows agenticos acotados, copilots, sistemas de retrieval, herramientas internas de IA y arneses de evaluación que tus ingenieros pueden operar después del handover.

Construcción de aplicaciones agenticas

Construye una app agentica o herramienta de IA en producción — evaluación primero, contratos de tools, usuario real en semana 2, handover operable en 6 a 14 semanas.

Cómo lo hacemos →

Revisión de sistemas agenticos

Una revisión acotada de un sistema de IA o agentico en producción o cerca — arquitectura, evaluación, tool use, costo, seguridad y operación.

Cómo lo hacemos →

Herramientas de IA para productos existentes

Integra herramientas agenticas de IA en productos existentes sin reconstruir todo el stack — búsqueda, drafting, triage, revisión, tool use y automatización de flujos.

Cómo lo hacemos →

Lo que escribimos

Últimos insights

Ensayos sobre lo que la fábrica nos enseña en producción. Sin “think pieces”.

Insights →

Trae el problema, el dueño, el rango de presupuesto y la fecha.

Esto es lo que cubrimos, en este orden:

Qué problema concreto resuelve esto, para quién, ahora.
Cómo se vería la evaluación. ¿Podemos escribirla?
Qué presupuesto y qué fecha tienes.
Si encajamos. Si no, a quién te recomendamos.

La llamada es estrictamente técnica: sin presentaciones de ventas ni discovery teatral. Si tu proceso requiere una licitación formal (RFP) antes de un brief técnico, escríbenos por correo.

Agenda una llamada Ver los servicios primero

Sistemas de IA en producción que tus ingenieros pueden operar. Construidos sobre una regla: escribir la evaluación antes del prompt.

Tres activos operativos bajo control de tu equipo antes del handover.

La evaluación, antes del prompt

El runbook que tu equipo de guardia abre a las 3 a. m.

IP, datos y la cuenta del modelo, a tu nombre — desde el día uno

Tres sistemas en vivo que puedes inspeccionar, no casos de estudio sanitizados.

BidGenie

DeOne

Microstax

Cuatro reglas operativas.

Evaluación antes que prompt. Siempre.

No hacemos PoCs huérfanas. Un usuario real entra al sistema en la semana 2.

El modelo más barato que pasa la evaluación gana.

Cero bait-and-switch. El mismo trío principal de principio a fin.

La aritmética. Publicada para que el fit sea claro antes de invertir tiempo técnico.

Decimos no cuando no podemos defender el resultado.

Apps agenticas y herramientas de IA, construidas para producción

Construcción de aplicaciones agenticas

Revisión de sistemas agenticos

Herramientas de IA para productos existentes

Últimos insights

El mapa de permisos que todo agente necesita antes de llamar tools

Usar IA para programar no es lo mismo que construir sistemas de IA

El runbook de IA para las 3 a.m.

Trae el problema, el dueño, el rango de presupuesto y la fecha.

Suscríbete para nuevos artículos