- Un año después del inicio de la revolución de la IA agente, hay una lección clara: hacerla bien requiere trabajo duro.
- Una transformación empresarial basada en agentes promete una productividad inigualable. Si bien algunas empresas disfrutan de éxitos iniciales con estas actividades, muchas más tienen dificultades para obtener valor de sus inversiones. En algunos casos, incluso están reduciendo personal, recontratando personal cuando los agentes han fracasado.
- Estos tropiezos son una evolución natural de cualquier nueva tecnología, y ya hemos observado este patrón en otras innovaciones. Hemos resumido los resultados de nuestro análisis en seis lecciones para ayudar a los líderes a aprovechar al máximo el valor de la IA agentic (véase el recuadro “¿Qué es la IA agentic?”).
No se trata del agente, se trata del flujo de trabajo.
Lograr valor comercial con IA agéntica requiere cambiar los flujos de trabajo. Sin embargo, a menudo las organizaciones se centran demasiado en el agente o la herramienta agéntica. Esto inevitablemente genera agentes de excelente apariencia que no mejoran el flujo de trabajo general, lo que resulta en un valor insuficiente.
Las iniciativas de IA agencial que se centran en reimaginar fundamentalmente flujos de trabajo completos —es decir, los pasos que involucran a personas, procesos y tecnología— tienen más probabilidades de generar resultados positivos. Comprender cómo los agentes pueden ayudar en cada uno de estos pasos es la clave para generar valor. Las personas seguirán siendo fundamentales para realizar el trabajo, pero ahora con diferentes agentes, herramientas y automatizaciones para apoyarlas.
Un punto de partida importante para rediseñar los flujos de trabajo es mapear los procesos e identificar los puntos clave de conflicto de los usuarios. Este paso es crucial para diseñar sistemas de agentes que reduzcan el trabajo innecesario y permitan a los agentes y a las personas colaborar y alcanzar los objetivos de negocio de forma más eficiente y eficaz. Esta colaboración puede darse mediante ciclos de aprendizaje y mecanismos de retroalimentación, creando un sistema que se refuerza a sí mismo. Cuanto más se utilizan los agentes, más inteligentes y alineados se vuelven.
Consideremos un proveedor de servicios legales alternativos que trabajaba para modernizar sus procesos de revisión de contratos. El razonamiento jurídico en el ámbito de la empresa evolucionaba constantemente, con nueva jurisprudencia, matices jurisdiccionales e interpretaciones de políticas, lo que dificultaba la codificación de la experiencia.
Para tener en cuenta la variabilidad natural, el equipo diseñó sus sistemas de agentes para que aprendieran dentro del flujo de trabajo. Por ejemplo, cada edición del usuario en el editor de documentos se registraba y categorizaba. Esto proporcionaba a los ingenieros y científicos de datos un rico flujo de retroalimentación, que luego podían usar para capacitar a los agentes, ajustar la lógica de las indicaciones y enriquecer la base de conocimientos. Con el tiempo, los agentes podían codificar nuevos conocimientos.
Centrarse en el flujo de trabajo en lugar del agente permitió a los equipos implementar la tecnología adecuada en el momento oportuno, lo cual es especialmente importante al rediseñar flujos de trabajo complejos de varios pasos (exhibición). Por ejemplo, las compañías de seguros suelen tener grandes flujos de trabajo de investigación que abarcan múltiples pasos (como la gestión de reclamaciones y la suscripción), y cada paso requiere diferentes tipos de actividades y tareas cognitivas. Las empresas pueden rediseñar este tipo de flujos de trabajo implementando cuidadosamente una combinación específica de sistemas basados en reglas, IA analítica, IA genérica y agentes, todo ello respaldado por un marco de orquestación común (como marcos de código abierto como AutoGen, CrewAI y LangGraph). En estos casos, los agentes son los orquestadores e integradores, que acceden a las herramientas e integran los resultados de otros sistemas en su contexto. Son el pegamento que unifica el flujo de trabajo para que ofrezca un cierre real con menor necesidad de intervención.
Los agentes no siempre son la respuesta
Los agentes de IA pueden hacer mucho, pero no deberían usarse necesariamente para todo. Con demasiada frecuencia, los líderes no analizan con suficiente detalle el trabajo necesario ni se preguntan si un agente sería la mejor opción para realizarlo.
Para evitar inversiones desperdiciadas o complejidades indeseadas, los líderes empresariales pueden abordar el rol de los agentes de forma similar a como lo hacen al evaluar a las personas para un equipo de alto rendimiento. La pregunta clave es: “¿Cuál es el trabajo a realizar y cuáles son los talentos relativos de cada posible miembro del equipo (o agente) para colaborar y alcanzar esos objetivos?”. Los problemas empresariales a menudo se pueden abordar con enfoques de automatización más sencillos, como la automatización basada en reglas, el análisis predictivo o la generación de solicitudes con modelos de lenguaje extensos (LLM), que pueden ser más fiables que los agentes preconfigurados.
Antes de precipitarse en una solución agencial, los líderes empresariales deben evaluar las exigencias de la tarea. En la práctica, esto significa tener claro cuán estandarizado debe ser el proceso, cuánta variabilidad debe gestionar y qué partes del trabajo son las más adecuadas para los agentes.
En cierto modo, estos problemas son sencillos. Por ejemplo, los flujos de trabajo de baja varianza y alta estandarización, como la incorporación de inversores o la divulgación regulatoria, tienden a estar estrictamente regulados y seguir una lógica predecible. En estos casos, los agentes basados en LLM no deterministas podrían añadir más complejidad e incertidumbre que valor.
En cambio, los flujos de trabajo con alta variabilidad y baja estandarización podrían beneficiarse significativamente de los agentes. Por ejemplo, se desplegaron agentes en una empresa de servicios financieros para extraer información financiera compleja, lo que redujo la validación humana necesaria y agilizó los flujos de trabajo. Estas tareas exigían agregación de información, comprobaciones de verificación y análisis de cumplimiento, tareas en las que los agentes pueden ser eficaces.
Lo importante es no caer en la trampa de la mentalidad binaria de “agente/no agente”. Algunos agentes pueden realizar bien tareas específicas, otros pueden ayudar a las personas a realizar mejor su trabajo y, en muchos casos, diferentes tecnologías podrían ser más apropiadas. La clave está en determinar qué herramienta o agente se adapta mejor a la tarea, cómo las personas pueden trabajar con ellos de forma más eficaz y cómo combinar agentes y trabajadores para obtener el máximo rendimiento. La eficacia de la colaboración entre personas, agentes y herramientas es la clave del valor (véase el recuadro “Reglas generales de alto nivel al considerar qué herramientas de IA utilizar”).
Detenga la ‘IA deficiente’: invierta en evaluaciones y genere confianza con los usuarios
Uno de los problemas más comunes que enfrentan los equipos al implementar agentes de IA son los sistemas agénticos que parecen impresionantes en las demostraciones, pero frustran a los usuarios, quienes son los verdaderos responsables del trabajo. Es común escuchar a los usuarios quejarse de la “laguna de la IA” o de la baja calidad de los resultados. Los usuarios pierden rápidamente la confianza en los agentes y los niveles de adopción son bajos. Cualquier mejora en la eficiencia lograda mediante la automatización puede verse fácilmente contrarrestada por una pérdida de confianza o una disminución de la calidad.
Una lección aprendida con esfuerzo sobre este problema recurrente es que las empresas deben invertir fuertemente en el desarrollo de sus agentes, al igual que lo hacen con el desarrollo de sus empleados. Como nos comentó un líder empresarial: «Incorporar agentes es más como contratar a un nuevo empleado que implementar software». Los agentes deben recibir descripciones de trabajo claras, ser integrados y recibir retroalimentación continua para que sean más eficaces y mejoren regularmente.
Desarrollar agentes eficaces es una tarea compleja que requiere aprovechar la experiencia individual para crear evaluaciones (o “evals”) y codificar las mejores prácticas con la suficiente granularidad para las tareas específicas. Esta codificación sirve tanto como manual de entrenamiento como prueba de rendimiento para el agente, garantizando que funcione según lo previsto.
Estas prácticas pueden existir en procedimientos operativos estándar o como conocimiento tácito en la mente de las personas. Al codificar las prácticas, es importante centrarse en lo que distingue a los mejores empleados del resto. Para los representantes de ventas, esto podría incluir cómo dirigen la conversación, gestionan las objeciones y se adaptan al estilo del cliente (véase el recuadro “Tipos de evaluación”).
Es crucial que los expertos sigan participando para evaluar el rendimiento de los agentes a lo largo del tiempo; en este ámbito no se puede optar por “iniciar y marcharse”. Este compromiso con la evaluación requiere, por ejemplo, que los expertos anoten o etiqueten los resultados deseados (y quizás no deseados) para las entradas dadas, que a veces pueden ser miles para agentes más complejos. De esta manera, los equipos pueden evaluar cuánto acertó o falló un agente y realizar las correcciones necesarias.
Un banco global adoptó este enfoque al transformar sus procesos de conocimiento del cliente y de análisis de riesgo crediticio. Siempre que la recomendación del agente sobre el cumplimiento de las directrices de admisión difería del criterio humano, el equipo identificaba las deficiencias lógicas, refinaba los criterios de decisión y repetía las pruebas.
En un caso, por ejemplo, el análisis inicial de los agentes fue demasiado general. El equipo proporcionó esa retroalimentación y luego desarrolló e implementó agentes adicionales para garantizar que la profundidad del análisis proporcionara información útil con el nivel de granularidad adecuado. Una forma de lograrlo fue preguntar a los agentes “¿por qué?” repetidamente. Este enfoque garantizó el buen rendimiento de los agentes, lo que aumentó la probabilidad de que los usuarios aceptaran sus resultados.
Facilite el seguimiento y la verificación de cada paso
Al trabajar con pocos agentes de IA, revisar su trabajo y detectar errores puede ser bastante sencillo. Pero a medida que las empresas implementan cientos, o incluso miles, de agentes, la tarea se vuelve más compleja. Para agravar el problema, muchas empresas solo rastrean los resultados. Por lo tanto, cuando se produce un error —y siempre habrá errores a medida que las empresas amplían el número de agentes—, es difícil determinar con precisión qué falló.
El rendimiento de los agentes debe verificarse en cada paso del flujo de trabajo. Integrar la supervisión y la evaluación en el flujo de trabajo permite a los equipos detectar errores con antelación, perfeccionar la lógica y mejorar continuamente el rendimiento, incluso después de la implementación de los agentes.
Por ejemplo, en un flujo de trabajo de revisión de documentos, el equipo de producto de un proveedor de servicios legales alternativos observó una disminución repentina de la precisión cuando el sistema detectaba un nuevo conjunto de casos. Sin embargo, dado que habían desarrollado el flujo de trabajo de Agentic con herramientas de observabilidad para rastrear cada paso del proceso, el equipo identificó rápidamente el problema: ciertos segmentos de usuarios enviaban datos de baja calidad, lo que generaba interpretaciones incorrectas y recomendaciones posteriores deficientes.
Con esa información, el equipo mejoró sus prácticas de recopilación de datos, proporcionó directrices de formato de documentos a las partes interesadas y ajustó la lógica de análisis del sistema. El rendimiento de los agentes se recuperó rápidamente.
El mejor caso de uso es el caso de reutilización.
En su afán por avanzar con la IA agencial, las empresas suelen crear un agente único para cada tarea identificada. Esto puede generar redundancia y desperdicio significativos, ya que un mismo agente puede realizar diferentes tareas que comparten muchas de las mismas acciones (como ingerir, extraer, buscar y analizar).
Decidir cuánto invertir en la creación de agentes reutilizables (en comparación con un agente que ejecuta una tarea específica) es similar al problema clásico de la arquitectura de TI: las empresas necesitan desarrollar rápidamente, pero sin limitarse a opciones que limiten sus capacidades futuras. Lograr ese equilibrio suele requerir mucho juicio y análisis.
Identificar las tareas recurrentes es un buen punto de partida. Las empresas pueden desarrollar agentes y componentes de agentes que se puedan reutilizar fácilmente en diferentes flujos de trabajo y que faciliten el acceso a ellos a los desarrolladores. Esto incluye el desarrollo de un conjunto centralizado de servicios validados (como la observabilidad LLM o las indicaciones preaprobadas) y recursos (por ejemplo, patrones de aplicación, código reutilizable y materiales de formación) fáciles de localizar y usar. Integrar estas capacidades en una única plataforma es fundamental. Según nuestra experiencia, esto ayuda a eliminar prácticamente entre el 30 % y el 50 % del trabajo no esencial que suele requerirse.
Los humanos siguen siendo esenciales, pero sus roles y números cambiarán
A medida que los agentes de IA siguen proliferando, la pregunta sobre el papel que desempeñarán los humanos ha generado mucha ansiedad: por un lado, sobre la seguridad laboral y, por otro, sobre las altas expectativas de aumento de la productividad. Esto ha generado opiniones muy divergentes sobre el papel de los humanos en muchos empleos actuales.
Para ser claros: los agentes podrán lograr mucho, pero los humanos seguirán siendo una parte esencial de la fuerza laboral, incluso si el tipo de trabajo que realizan tanto agentes como humanos cambia con el tiempo. Las personas deberán supervisar la precisión del modelo, garantizar el cumplimiento, usar su criterio y gestionar casos extremos, por ejemplo. Y, como ya comentamos, los agentes no siempre serán la mejor solución, por lo que se necesitarán personas que trabajen con otras herramientas, como modelos de aprendizaje automático. Sin embargo, es probable que la cantidad de personas que trabajan en un flujo de trabajo específico cambie y, a menudo, sea menor una vez que el flujo de trabajo se transforme con agentes. Los líderes empresariales deberán gestionar estas transiciones como lo harían con cualquier programa de cambio y asignar cuidadosamente el trabajo necesario para capacitar y evaluar a los agentes.
Otra gran lección de nuestra experiencia es que las empresas deben rediseñar el trabajo de forma deliberada para que las personas y los agentes puedan colaborar eficazmente. Sin ese enfoque, incluso los programas de agentes más avanzados corren el riesgo de sufrir fallos silenciosos, errores acumulados y el rechazo de los usuarios.
Tomemos el ejemplo del proveedor de servicios legales alternativos mencionado anteriormente, que quería usar agentes para un flujo de trabajo de análisis legal. Al diseñar el flujo de trabajo, el equipo se dedicó a identificar dónde, cuándo y cómo integrar la participación humana. En un caso, los agentes pudieron organizar las reclamaciones principales y los montos en dólares con gran precisión, pero era importante que los abogados las revisaran y aprobaran, dada la importancia de las reclamaciones para todo el caso.
De igual manera, los agentes podían recomendar estrategias de plan de trabajo para cada caso, pero dada la importancia de la decisión, era crucial que las personas no solo revisaran, sino que también ajustaran la recomendación. Los agentes también estaban programados para identificar casos excepcionales y anomalías, lo que ayudaba a los abogados a desarrollar perspectivas más integrales. Alguien aún tenía que firmar el documento al final del proceso, respaldando la decisión legal con la licencia y las credenciales de la persona.
Una parte importante de este diseño colaborativo entre humanos y agentes es el desarrollo de interfaces de usuario visuales sencillas que faciliten la interacción entre las personas y los agentes. Por ejemplo, una compañía de seguros de daños desarrolló elementos visuales interactivos (como cuadros delimitadores, resaltados y desplazamiento automático) para ayudar a los revisores a validar rápidamente los resúmenes generados por IA. Al hacer clic en una información, por ejemplo, la aplicación se desplazaba directamente a la página correcta y resaltaba el texto correspondiente. Este enfoque en la experiencia del usuario ahorró tiempo, redujo las dudas y generó confianza en el sistema, lo que se tradujo en una aceptación del usuario cercana al 95 %.
El mundo de los agentes de IA evoluciona rápidamente, por lo que podemos esperar aprender muchas más lecciones. Sin embargo, a menos que las empresas aborden sus programas de agentes con el aprendizaje en mente (y en la práctica), es probable que repitan errores y ralenticen su progreso.
EN
ES
EU


