zoff.tech

Fábrica de software de IA · Los mismos tres ingenieros, en cada proyecto · 4 a 6 al año

Sistemas de IA en producción que tus ingenieros pueden operar. Construidos sobre una regla: escribir la evaluación antes del prompt.

La mayoría de los proyectos de IA sobreviven al demo y fallan en la primera semana real de operación. Nosotros entregamos sistemas que tu equipo de guardia puede operar a las 3 a. m., con un arnés de evaluación bajo control de tu equipo y probado por un usuario real en la semana 2, cuando la arquitectura todavía es barata de cambiar.

Qué te llevas

Tres activos operativos bajo control de tu equipo antes del handover.

La mayoría de los proyectos terminan con un repo y una buena intención. Los nuestros terminan con tres cosas que tu equipo puede operar sin nosotros.

eval

La evaluación, antes del prompt

Cada build arranca con un dataset de evaluación y umbrales explícitos. Si no podemos escribir una evaluación defendible en los primeros 14 días, cancelamos el proyecto y te devolvemos el fee de discovery. Lo hemos hecho dos veces.

runbook

El runbook que tu equipo de guardia abre a las 3 a. m.

No la diapositiva con flechas. El documento concreto: alertas, escenarios de degradación, cuándo despertar a un humano, cómo hacer rollback. Lo entregamos firmado en la última semana.

ip

IP, datos y la cuenta del modelo, a tu nombre — desde el día uno

Tu repo. Tus credenciales de OpenAI / Anthropic / AWS. Tus dashboards. Cuando entregamos, tu equipo no necesita pedirnos credenciales: ya son suyas y siempre lo fueron.

Lo que enviamos a producción

Tres sistemas en vivo que puedes inspeccionar, no casos de estudio sanitizados.

Microstax, BidGenie, DeOne — sistemas públicos de IA con decisiones de producto, tradeoffs y restricciones operativas visibles. Líderes de producto pueden inspeccionar las decisiones de flujo. Equipos técnicos pueden revisar restricciones, modos de falla y supuestos operativos.

Ver los tres →

Cómo trabajamos

Cuatro reglas operativas.

Cada una ha cerrado una conversación comercial. Cada una ha protegido una entrega.

  1. 01

    Evaluación antes que prompt. Siempre.

    La mayoría escribe el prompt primero. Si parece bien, lo envían. Nosotros no. Escribimos el set de evaluación primero — preguntas reales, respuestas reales, umbrales reales. Esa evaluación decide si un cambio se mergea. Sin evaluación verde, sin merge. El equipo termina dueño de la decisión, no de nuestra opinión.

  2. 02

    No hacemos PoCs huérfanas. Un usuario real entra al sistema en la semana 2.

    Una PoC sin camino a producción suele esconder las decisiones difíciles. Elegimos a un usuario real (habitualmente alguien de tu equipo) y le ponemos en la mano lo que tenemos hasta ese momento. Lo que aprendemos en la semana 2 cambia lo que entregamos en la semana 8. Las decisiones de arquitectura se toman contra una transcripción, no solo en una pizarra.

  3. 03

    El modelo más barato que pasa la evaluación gana.

    Calidad, latencia y costo se evalúan juntos. Frontier cuando es necesario; modelo más pequeño cuando no. Esa decisión la toma la evaluación, no la relación con un proveedor. En builds recientes, las rutas de producción que no necesitaban razonamiento frontier quedaron por debajo de $0.50 / 1M tokens — un recorte del 80%+ frente a un build que va a frontier por defecto. La diferencia no es solo costo: es latencia, throughput y la libertad de re-evaluar cuando el problema cambie.

  4. 04

    Cero bait-and-switch. El mismo trío principal de principio a fin.

    Pagas por ejecución de nivel senior, no por capacitación de juniors. El mismo trío—arquitecto, ingeniero y diseñador—que define tu sistema escribe el código, las evaluaciones y los runbooks. Limitamos nuestros proyectos para proteger este enfoque.

La aritmética

La aritmética. Publicada para que el fit sea claro antes de invertir tiempo técnico.

Tarifa fija o tiempo y materiales, según el riesgo. Te decimos qué modelo proponemos en la primera llamada y por qué.

Discovery + evaluación
desde $8k · 1–2 semanas
Build (pequeño)
$40–80k · 6–8 semanas
Build (mediano)
$80–160k · 10–14 semanas
Auditoría / revisión
$15–25k · 3 semanas · precio fijo

Publicamos los precios porque los rangos opacos consumen ciclos de compras antes de que el fit técnico esté claro. Si estos rangos encajan con tu presupuesto, hablaremos de ingeniería en la primera llamada, no de diapositivas de venta.

A qué decimos no

Decimos no cuando no podemos defender el resultado.

Ejemplos concretos del último año:

  • "RAG sobre todos nuestros documentos." No hay pregunta concreta, no hay evaluación posible.
  • Pruebas de concepto sin planes de despliegue en producción. Diseñamos código para ser operado, no prototipos para ser archivados.
  • Un agente que reemplace a humanos en decisiones legales, médicas o financieras.
  • Proyectos donde el criterio de éxito es "lo sabremos cuando lo veamos."
  • Proyectos donde el prompt se trata como el producto y la operación queda para después.

Si tu proyecto cae fuera de nuestro enfoque, te presentaremos a los equipos más adecuados para ese camino. Esa introducción siempre es gratuita.

Las tres formas

Apps agenticas y herramientas de IA, construidas para producción

Diseñamos y enviamos workflows agenticos acotados, copilots, sistemas de retrieval, herramientas internas de IA y arneses de evaluación que tus ingenieros pueden operar después del handover.

Lo que escribimos

Últimos insights

Ensayos sobre lo que la fábrica nos enseña en producción. Sin “think pieces”.

Insights

Trae el problema, el dueño, el rango de presupuesto y la fecha.

Esto es lo que cubrimos, en este orden:

  1. Qué problema concreto resuelve esto, para quién, ahora.
  2. Cómo se vería la evaluación. ¿Podemos escribirla?
  3. Qué presupuesto y qué fecha tienes.
  4. Si encajamos. Si no, a quién te recomendamos.

La llamada es estrictamente técnica: sin presentaciones de ventas ni discovery teatral. Si tu proceso requiere una licitación formal (RFP) antes de un brief técnico, escríbenos por correo.

Suscríbete para nuevos artículos

Ensayos de ingeniería de IA. Sin relleno comercial. Cancela cuando quieras.