Orquestación de agentes de IA: guía práctica

La mayoría de los equipos suma un segundo agente antes de que el primero haga bien su trabajo. El impulso es razonable. Un solo agente que responde preguntas de facturación, agenda citas, revisa el estado de pedidos y calma a clientes molestos tiende a hacer las cuatro cosas a medias. Repartir esas tareas entre agentes especializados ayuda, pero solo si algo los coordina. Esa capa de coordinación es lo que describe la orquestación de agentes de IA: la lógica que decide qué agente atiende una solicitud, qué contexto viaja con ella y cuándo el control pasa a otro agente o a una persona.

Qué coordina realmente la orquestación de agentes de IA

La orquestación no es un modelo ni es un agente. Es la capa de control que se sitúa por encima de tus agentes y gestiona tres cosas: enrutamiento, contexto y transferencia.

El enrutamiento decide qué agente recibe un mensaje entrante. El contexto es la memoria compartida que acompaña a una conversación mientras pasa entre agentes, para que el agente de facturación sepa lo que el cliente ya le contó al agente inicial. La transferencia es el momento en que un agente pasa la conversación a otro, o a una persona, con suficiente estado para que el cliente nunca tenga que repetirse.

Si aciertas en esas tres cosas, una configuración de IA con varios agentes se siente como un único asistente competente. Si fallas en cualquiera de ellas, el cliente nota las costuras de inmediato.

Los patrones de orquestación que importan para la mayoría de las empresas

A los diagramas de los proveedores les encanta mostrar enjambres y mallas de docenas de agentes negociando entre sí. La mayoría de las empresas no necesitan nada de eso. Tres patrones cubren la gran mayoría de las implementaciones reales.

Enrutamiento por intención

Un único agente de entrada lee el primer mensaje, clasifica lo que el cliente quiere y lo enruta al especialista correcto. Un mensaje de WhatsApp que dice 'dónde está mi pedido' va al agente de estado de pedidos. 'Quiero un reembolso' va a facturación. Este es el patrón orchestrator-worker y, en la práctica, es el que más usarás.

La parte difícil no es el enrutamiento. Es lo que pasa cuando la clasificación es incorrecta. Un cliente que dice 'mi pedido está mal y quiero que me devuelvan el dinero' toca dos agentes. Decide de antemano si tu enrutador elige uno, ejecuta ambos o hace una pregunta aclaratoria. Nosotros optamos por defecto por una pregunta aclaratoria cuando la intención es ambigua, porque un enrutamiento incorrecto cuesta más confianza que un intercambio extra.

Transferencia entre agentes y hacia personas

La transferencia de agentes es donde la mayoría de las orquestaciones falla en silencio. Cuando el agente de estado de pedidos se da cuenta de que el problema es en realidad una disputa de facturación, tiene que pasar la conversación junto con todo lo que el cliente ya dijo. Si el agente de facturación arranca en frío y vuelve a pedir el número de pedido, el cliente concluye que todo el sistema está roto.

La transferencia a una persona merece la misma disciplina. En Reach, la transferencia a una persona es una acción de primer nivel, no un estado de error. El agente que escala escribe un resumen breve, adjunta el historial de la conversación y enruta a la cola correcta. La persona retoma a mitad de contexto. Trata a la persona como un especialista más dentro del grafo de orquestación, no como el lugar donde las conversaciones van a morir.

Dónde se rompe la orquestación de agentes de IA

Tres modos de fallo aparecen una y otra vez.

La pérdida de contexto en la transferencia es la más común. Cada agente tiene parte del panorama y ninguno lo tiene completo. Resuélvelo haciendo que el estado de la conversación sea compartido y explícito, no reconstruido a partir del historial de mensajes en cada salto.

Los bucles son el segundo. El agente A decide que en realidad es trabajo de B, B decide que en realidad es trabajo de A, y el cliente ve la conversación rebotar. Una regla simple ayuda: un agente puede transferir, pero una conversación solo puede transferirse un número fijo de veces antes de pasar a una persona.

Las respuestas contradictorias son el tercero. El agente de ventas promete entrega al día siguiente, el agente de pedidos dice tres días. Esto es un problema de conocimiento disfrazado de orquestación. Los agentes que comparten una sola base de conocimiento no se contradicen. Los agentes con instrucciones separadas y datos separados sí lo harán.

Un ejemplo concreto

Una empresa de servicios a domicilio opera tres agentes en WhatsApp y en su sitio web. Un agente inicial saluda y clasifica. Un agente de agenda reserva y reprograma visitas, con acceso al calendario. Un agente de facturación gestiona facturas y reembolsos, con acceso al sistema de pagos.

Un cliente escribe: 'se suponía que vendrían el martes y aun así me cobraron.' El agente inicial lo clasifica como agenda y facturación a la vez y, en lugar de adivinar, hace una pregunta: '¿Quieres reprogramar la visita, resolver el cobro, o ambas cosas?' El cliente dice ambas. El agente inicial enruta primero a agenda, que vuelve a reservar y escribe la nueva fecha en el contexto compartido. Agenda transfiere a facturación con todo el hilo. Facturación ve la visita perdida, emite el reembolso y confirma ambas acciones en un solo mensaje.

Fíjate en lo que lo hizo funcionar: una clasificación, una pregunta aclaratoria, contexto compartido a lo largo de dos transferencias y una sola base de conocimiento para que ningún agente contradijera al otro. Ese es el flujo de trabajo de agentes de IA haciendo su trabajo. Nada de esto requirió una malla de agentes negociando.

Cuándo no necesitas orquestación

La orquestación añade latencia, costo y superficie para errores. Un único agente bien configurado, con una buena base de conocimiento y un camino limpio hacia una persona, resuelve más de lo que la gente espera. Si tu agente responde preguntas de un solo dominio, o tu volumen es lo bastante bajo como para que una persona revise la mayoría de las conversaciones de todos modos, un segundo agente es prematuro.

La señal de que de verdad necesitas orquestación es concreta: un agente está haciendo malabares con responsabilidades que requieren herramientas distintas, permisos distintos o tonos distintos, y la calidad está cayendo por eso. Hasta que veas eso, la orquestación es complejidad que estás comprando por especulación.

Monitorear conversaciones orquestadas

Una vez que una conversación cruza dos o tres agentes, no puedes depurarla leyendo una sola transcripción. Necesitas ver el recorrido: qué agente atendió cada turno, dónde ocurrieron las transferencias, dónde se perdió el cliente.

Esta es la parte que la mayoría de las guías menciona y nunca explica. En la práctica significa registrar cada decisión de enrutamiento y cada transferencia con su motivo, y luego revisar las conversaciones que terminaron mal. Una plataforma de agentes demuestra aquí su valor. Reach expone el historial de conversaciones y las simulaciones, para que puedas reproducir una conversación real contra una configuración modificada antes de publicarla. La orquestación sin esta visibilidad es un sistema que solo puedes desear que funcione, no mejorar.

Empieza con un agente, divídelo solo cuando la calidad te obligue e instrumenta las transferencias antes de añadir el tercer agente. Las empresas que aciertan en esto no son las que operan más agentes. Son aquellas cuyos clientes nunca notaron cuántos agentes había.