Cómo crear un agente de IA: guía práctica

La mayoría de las guías sobre cómo crear un agente de IA dan por hecho que quieres programar en Python. Te llevan por frameworks, llamadas a funciones y un bucle determinista. Ese camino sirve si tienes ingenieros de sobra. La mayoría de los equipos que arman su primer agente no los tienen, y tampoco les hacen falta.

Nosotros construimos y operamos agentes en Reach, en WhatsApp y en la web, para soporte, ventas y operaciones. La parte difícil casi nunca es el modelo. Son las docenas de decisiones pequeñas que determinan si el agente ayuda a un cliente o empeora las cosas en silencio. Esta guía recorre esas decisiones en el orden que de verdad importa.

Qué significa realmente crear un agente de IA

Un agente de IA no es un chatbot con un mejor guion. Un chatbot responde lo que le dijeron que respondiera. Un agente decide qué hacer a continuación, usa herramientas para obtener información o ejecutar una acción, y sabe cuándo detenerse o derivar. Esa diferencia es todo el punto, y también es donde fallan la mayoría de los primeros intentos.

Cuando creas un agente de IA defines cuatro cosas: qué sabe, qué puede hacer, dónde habla con las personas y cuándo debe hacerse a un lado. Acierta en eso y el modelo se encarga del resto. Falla en eso y ningún ajuste de prompt te salva.

Empieza con un solo trabajo, no con una personalidad

El instinto es construir un asistente general que lo haga todo. Resístelo. Un cliente de logística nuestro quería un agente para avisos de despacho, alta de conductores y reclamos de clientes. Lanzamos primero solo el agente de avisos de despacho. Respondía bien una sola pregunta: dónde está mi envío. En dos semanas manejaba el 70 por ciento de esos mensajes sin un humano.

Elige un trabajo que ocurra seguido, con una definición clara de 'terminado' y que se pueda medir. 'Responder preguntas de estado de pedido' es un trabajo. 'Mejorar la experiencia del cliente' no lo es. Cuanto más acotado sea el primer agente, más rápido descubres cuáles son tus casos límite reales.

Cómo crear un agente de IA en cinco decisiones

Una vez que tienes el trabajo, crear el agente se reduce a cinco decisiones concretas. Ninguna requiere código en una plataforma basada en configuración.

1. Define el trabajo y su condición de parada

Escribe exactamente qué hace el agente y, más importante, qué termina su turno. Un agente sin condición de parada entra en bucle, adivina o escala todo. Decide de antemano cuándo ya respondió, cuándo debe hacer una pregunta aclaratoria y cuándo debe derivar. La condición de parada no es un detalle. Es el límite de seguridad.

2. Dale el conocimiento correcto, no todo

Los equipos vuelcan todo su centro de ayuda, cada PDF y tres años de correos en la base de conocimiento y luego se preguntan por qué las respuestas se desvían. Un agente razona sobre lo que le das. Aliméntalo con contradicciones y elegirá una con total confianza. Cura primero un conjunto pequeño, actual y autoritativo. En Reach conectas ese conocimiento y observas qué fuentes cita realmente el agente, y desde ahí podas.

3. Elige las herramientas que puede invocar

Las herramientas son lo que convierte a un agente de hablador en ejecutor: buscar un pedido, revisar inventario, crear un ticket, agendar una devolución de llamada. Dale las dos a cuatro herramientas que el trabajo necesita y nada más. Cada herramienta de más es otra forma de que el agente haga algo inesperado. Entradas claras y alcance ajustado reducen los bucles mucho más que un prompt ingenioso.

4. Decide dónde se ejecuta

Un agente en tu sitio web atiende un momento distinto al de uno en WhatsApp. Quien visita la web está investigando y espera profundidad. Quien usa WhatsApp quiere una respuesta rápida y conversacional y abandonará un muro de texto. Reach ejecuta el mismo agente en ambos canales, pero el encuadre debe cambiar: turnos más cortos y derivación más rápida en WhatsApp, respuestas más completas en la web. Decide el canal antes de escribir una sola instrucción, porque cambia cómo debe hablar el agente.

5. Define las reglas de derivación antes de lanzar

Todo agente se topará con algo que no debería manejar. La pregunta es si lo sabe. Define los disparadores de derivación de forma explícita: baja confianza, un reembolso por encima de un umbral, un tono molesto, una pregunta legal o médica. Una derivación limpia que lleva toda la conversación a un humano gana sobre un agente que improvisa en una situación que no le corresponde. Tratamos el diseño de la derivación como parte de construir el agente, no como algo posterior.

Construir desde cero o configurar: la cuestión del código

Este es el intercambio honesto. Construir desde cero con un framework te da control total y una larga factura de mantenimiento. Eres dueño de la orquestación, los reintentos, los registros, las integraciones de canales y cada actualización cuando cambia el modelo de base. Para un producto realmente novedoso, ese control vale la pena.

Para la gran mayoría de los agentes de negocio, estás rehaciendo la misma plomería que rehace todo el mundo. Una plataforma basada en configuración se encarga de la orquestación, las conexiones de canal, la recuperación de conocimiento y la derivación, y tú inviertes el tiempo en las decisiones de arriba. La mayor parte de nuestro trabajo a medida no se construye de la nada. Es Reach extendida o acotada para encajar en un flujo de trabajo específico. Empieza configurando. Baja al código solo donde tengas una razón real.

Cómo probar un agente de IA antes que tus clientes

No lances un agente poniéndolo frente a clientes reales y mirando. Pruébalo contra las conversaciones que ya tienes. Toma una muestra de tickets o chats pasados y pásalos por el agente. Encontrarás los huecos rápido: la pregunta formulada de tres maneras de las que solo maneja una, el caso límite que nadie documentó, la llamada a herramienta que falla en silencio.

Reach incluye simulaciones justo para esto, para que puedas reproducir conversaciones del mundo real y ver dónde se rompe el agente antes de que alguien externo lo vea. Sea cual sea la herramienta que uses, el principio se mantiene: un agente que nunca se probó contra entradas reales y desordenadas no está listo, por buena que se viera la demo.

Una primera construcción realista, de principio a fin

Así se ve un primer agente cuando lo creas de esta manera. Supón que tienes una marca de e-commerce y las preguntas de estado de pedido inundan tu bandeja. El trabajo: responder 'dónde está mi pedido' a partir del mensaje de un cliente. La condición de parada: una vez que el agente dio un estado de seguimiento o pidió un número de pedido que no tiene.

Conocimiento: tu política de envíos y las preguntas frecuentes, nada más. Herramientas: una sola búsqueda que recibe un número de pedido o un correo y devuelve el estado de seguimiento más reciente. Canal: WhatsApp, porque ahí es donde esos clientes ya te escriben. Derivación: cualquier mención de un artículo dañado, un reembolso o una entrega que pasó la fecha prometida va a un humano con la conversación adjunta.

Eso es un agente completo. Hace un trabajo, mantiene un límite claro y puedes medirlo por la proporción de mensajes de estado de pedido que cierra sin ayuda. Cuando esté estable, agregas el siguiente trabajo. Así se construyen agentes duraderos, una responsabilidad acotada a la vez, no un asistente gigante que intenta todo y no confía en nada.

La única métrica que te dice que funciona

Si vas a seguir un solo número, sigue la resolución sin derivación: la proporción de conversaciones que el agente terminó correctamente por su cuenta. Es honesta de una manera en que las métricas de volumen y tiempo de respuesta no lo son. Un agente puede responder rápido y aun así equivocarse. La resolución sin derivación, contrastada con una muestra que de verdad leas, te dice si la cosa se está ganando su lugar.

Acompáñala con una lectura rápida de las conversaciones que sí derivó. Esas son tu hoja de ruta. La mayoría se agrupan en dos o tres patrones, y cada patrón es una pieza de conocimiento que falta, una herramienta que falta o un límite que dejaste demasiado flojo. Corrige el patrón principal, mira moverse el número, repite.

Qué se rompe después del lanzamiento

El trabajo no termina al salir en vivo. Los agentes se desvían cuando tus productos, precios y políticas cambian y la base de conocimiento se queda atrás. Aparecen nuevas formas de preguntar que el agente no resuelve bien. Cambia la API de una herramienta y las respuestas se degradan en silencio.

Vigila tres cosas en el primer mes: la tasa de derivación, las preguntas que dispararon derivaciones y las conversaciones que los clientes abandonaron. Esas te dicen dónde agregar conocimiento, ajustar una herramienta o corregir una condición de parada. Crear un agente de IA no es un lanzamiento. Es un bucle, y los equipos que lo tratan así son los que, seis meses después, todavía tienen agentes útiles.