May 18, 2026 • 6 min read
AI & Automation Specialist
I design AI-powered communication systems. My work focuses on voice agents, WhatsApp chatbots, AI assistants, and workflow automation built primarily on Twilio, n8n, and modern LLMs like OpenAI and Claude. Over the past 7 years, I've shipped 30+ automation projects handling 250k+ monthly interactions.
If you enjoy the content that I make, you can subscribe and receive insightful information through email. No spam is going to be sent, just updates about interesting posts or specialized content that I talk about.
Si llegaste hasta esta página probablemente viste mi short donde explico por qué elegir un solo modelo de inteligencia artificial para todo tu sistema te termina costando plata.
Uno de los errores más comunes cuando alguien construye su primer sistema de comunicación con IA es elegir el modelo mirando una tabla comparativa, y después usar siempre el mismo para todo el flujo.
Pero en sistemas reales, no hay un modelo que sea "el mejor". Hay un modelo correcto para cada tarea. Y cada tarea dentro de un sistema tiene una exigencia distinta.
Elegir mal genera problemas como:
pagás un modelo premium para tareas triviales que no lo necesitan
la factura se dispara sin que mejore el resultado para el cliente
elegís open source para ahorrar sin calcular el costo real de operarlo
tomás la decisión el primer día y nunca más la volvés a tocar
En esta página te dejo un resumen rápido del criterio y también el documento completo con la tabla de decisión y ejemplos de un sistema de WhatsApp real.
La tabla comparativa que viste en algún lado mide el modelo aislado, haciendo una sola cosa. Tu sistema no hace una sola cosa.
Un sistema de comunicación es una cadena: clasifica lo que entra, decide qué hacer, genera una respuesta, a veces extrae datos, a veces resume la conversación para pasarle el caso a una persona.
Cada eslabón de esa cadena tiene una exigencia distinta. El problema aparece cuando tratás a todos los eslabones como si fueran el más exigente. Ahí es donde el costo se dispara sin que mejore nada que el cliente pueda ver.
Esto es lo que importa para decidir, no el puntaje de un leaderboard.
Razonamiento fuerte, costo medio. Bueno para decisiones con varios pasos y lógica encadenada. Es un buen caballo de batalla, pero si lo usás para tareas triviales estás pagando capacidad que no se nota en el resultado final.
Contexto largo y mejor escritura. Fuerte para respuestas que el cliente va a leer, conversaciones largas y generación de código. La calidad es alta pero el costo por interacción suele ser bastante mayor. Se justifica donde el cliente ve la salida. Es caro si lo usás para clasificar.
Modelo liviano y barato. Resuelve volumen alto cuando no necesitás una respuesta minuciosa. El costo por mensaje es marginal. El riesgo es usarlo donde la calidad sí importa y degradar la experiencia sin darte cuenta.
Open source autoadministrado. Baja el costo de inferencia a casi cero a escala, pero el costo no desaparece, se muda. Pasa de la factura del proveedor a tu infraestructura: GPUs, mantenimiento, monitoreo y alguien que lo sostenga.
Tomemos un sistema típico de atención y ventas por WhatsApp con derivación a una persona cuando hace falta. Esto es lo que asigno a cada tarea.
Clasificar la intención del mensaje. Modelo liviano y barato. Saber si el cliente quiere precio, soporte o agendar es una decisión de pocas categorías. Es la tarea de más volumen y la que menos exige. Poner el modelo premium acá es el caso de manual de plata quemada.
Extraer datos puntuales (mail, fecha, monto). Modelo liviano más una validación encima. Es una tarea acotada y verificable. Si el dato es crítico, no subas de modelo, agregá una verificación. Más modelo no te da más certeza acá.
Generar la respuesta que el cliente va a leer. Contexto largo y mejor escritura. Esto es lo único que el cliente realmente percibe. Acá la calidad de redacción no es un lujo, es el producto. Es el lugar donde el modelo caro se justifica, y solo acá.
Resumir la conversación para el handoff humano. Depende del largo real de tus conversaciones. Si son largas y enredadas, contexto largo. Si son cortas, un modelo liviano resume bien y barato. Medilo antes de decidir, no asumas.
Lógica de negocio encadenada. Razonamiento fuerte, costo medio. Es la tarea menos frecuente del sistema. El error clásico es elegir el modelo de todo el sistema pensando en este caso, que aparece en el 5% de las interacciones, y pagarlo en el 100%.
Igual que mucha gente usa Sheets para todo cuando arma su primer agente, acá el error equivalente es usar el mismo modelo premium para todo el flujo.
Funciona en un prototipo. Pero en producción la cuenta no cierra, porque la clasificación y la extracción son la enorme mayoría de las llamadas al modelo, y la generación de respuesta es la minoría.
Si movés solo esas dos tareas de alto volumen a un modelo liviano, el resultado al cliente no cambia y la factura puede caer fuerte. Es la optimización con mejor relación esfuerzo sobre impacto que existe en estos sistemas, y casi nadie la hace porque eligieron un modelo el primer día y no lo volvieron a mirar.
En mi canal comparto ejemplos reales de cómo diseñar sistemas de IA para voz, WhatsApp y atención al cliente, con foco en las decisiones técnicas y lo que cuestan de verdad.
Si te interesa este tipo de análisis, podés encontrar más contenido técnico en mi canal de YouTube.
Si estás diseñando o ya corrés un sistema de comunicación con IA, preparé un documento donde desgloso el criterio completo de asignación de modelo por tarea.
En el documento vas a encontrar:
el trade-off real de cada tipo de modelo, ordenado por consecuencia de negocio
el criterio aplicado tarea por tarea sobre un sistema de WhatsApp real
cuándo el open source tiene sentido y cuándo no
una tabla de decisión para resolverlo de un vistazo
-Gonza