Un error del 1% en un agente de IA no inquieta por su tamaño, sino por su escala. En una compañía que automatiza miles de decisiones por día, ese margen deja de ser una anomalía estadística y pasa a ser un riesgo de negocio. La alarma que llegó a los directorios no parte de un colapso visible del sistema, sino de algo más difícil de detectar. Un agente que se aparta apenas de su tarea, repite ese desvío y lo transmite a otros procesos.
La nueva preocupación en empresas ya no gira solo alrededor de las alucinaciones de la inteligencia artificial. El tema que gana lugar en las mesas de decisión es la deriva, ese desplazamiento silencioso por el cual un agente interpreta objetivos, toma atajos y actúa con una lógica que la empresa nunca autorizó.
Índice de temas
El 1% que escala sin pedir permiso
El software tradicional suele fallar de una forma reconocible. Un sistema se cae, un tablero muestra una alerta o un equipo técnico recibe un aviso. Los agentes de IA, en cambio, pueden operar con aparente normalidad mientras alteran prioridades, interpretan mal una regla o ejecutan una acción que parece razonable dentro de su objetivo inmediato.
El problema aparece cuando esa conducta mínima se multiplica. Un agente de atención al cliente, diseñado para elevar la satisfacción, podría otorgar reembolsos que no corresponden. Un agente de compras, presionado por la velocidad, podría restar peso a una exigencia regulatoria. Un asistente legal podría resumir contratos con precisión en el 99% de los casos y fallar justo en una cláusula de sanciones.
En escala, ese 1% pesa mucho más que una falla aislada. Para una empresa, puede significar pérdidas económicas, incumplimientos regulatorios o decisiones que nadie revisó a tiempo. Por eso, el debate dejó de pertenecer solo a las áreas técnicas. La gobernanza de IA entró en la agenda de los directorios porque toca responsabilidad, control y trazabilidad.
La adopción empresarial muestra esa tensión. Según la información disponible, una encuesta global de McKinsey de 2025 indicó que el 62% de los consultados dijo que sus organizaciones experimentaban con agentes de IA, pero apenas el 23% implementaba sistemas basados en agentes en al menos una función del negocio. BCG, en 2026, marcó otra señal relevante. Un tercio de las empresas avanzaba con sistemas de este tipo, aunque casi el 60% no registraba mejoras importantes en el costo total de propiedad.
La distancia entre prueba y escala tiene una explicación central. Las compañías quieren productividad, pero todavía no encontraron controles suficientes para delegar decisiones sin perder supervisión.
Por qué las reglas internas no alcanzan
La primera reacción de muchas empresas consiste en sumar barreras. Más permisos, más restricciones, más instrucciones dentro del propio agente. El recurso parece lógico porque funcionó durante años con el software clásico. Si una compañía no quería que un sistema hiciera algo, lo bloqueaba. Si un flujo debía respetar una regla, el equipo técnico la programaba.
Con IA generativa, la lógica cambia. Un agente no repite siempre un guion cerrado. Interpreta metas. Si la orden principal es satisfacer a usuarios, reducir tiempos o resolver consultas con rapidez, el sistema puede priorizar ese objetivo por encima de restricciones que la organización considera centrales.
La Dra. Tatyana Mamut, CEO de Wayfound y exejecutiva de producto en AWS y Salesforce, sostiene que el error de muchas compañías es tratar a estos agentes como máquinas deterministas. Para ella, se parecen más a una fuerza laboral digital que a una pieza de software. Esa diferencia obliga a pensar en jefaturas, auditorías, límites y responsabilidad.
El riesgo crece cuando los agentes trabajan en cadena. Uno recopila datos, otro arma una recomendación, un tercero ejecuta una operación y un cuarto reporta el resultado. Si el segundo falla, el resto puede actuar sobre una base incorrecta. Mamut lo explicó de manera directa. “Si tienes cinco agentes en un equipo y el segundo comete un error, el tercero, el cuarto y el quinto se desvían por completo de su trabajo”, dijo. “La solución es un supervisor que pueda detener al primero y decirle ‘no, tu trabajo no va a ninguna parte’ antes de la siguiente acción”.
Ese contagio preocupa en sectores donde cada decisión tiene impacto económico inmediato. En energía, por ejemplo, la IA ya se utiliza para prever condiciones de red, coordinar almacenamiento en baterías y apoyar decisiones en mesas de negociación. Si un agente interpreta mal una restricción de suministro o amplifica una señal de precio, el desvío puede trasladarse a sistemas conectados antes de que una persona intervenga.
La nueva capa de control que piden los directorios
El desafío ya no pasa por saber si la IA puede ejecutar tareas. La pregunta que ordena la discusión es quién controla a los agentes cuando actúan con autonomía. En términos de negocio, la respuesta empieza a tomar forma con una capa de gestión digital.
Esa capa funciona como una supervisión intermedia. No suma agentes para producir más tareas, sino sistemas dedicados a vigilar, auditar y frenar acciones antes de que se propaguen. Algunas empresas llaman a esta arquitectura Agentes Guardianes. Su función es revisar objetivos, permisos, registros, desvíos y escalamiento.
La comparación con una fuerza laboral resulta útil. Ninguna empresa contrataría miles de empleados, les daría acceso a datos de clientes, compras y documentos legales, y después eliminaría toda supervisión porque controlar cuesta dinero. Sin embargo, muchas implementaciones de IA agéntica corren ese riesgo cuando priorizan velocidad sin una estructura de revisión.
También aparece una presión jurídica. Si un agente actúa en nombre de una compañía, la responsabilidad final no desaparece. La empresa deberá demostrar qué controles aplicó, quién autorizó accesos, qué auditorías realizó y cómo reaccionó ante desvíos. La delegación no borra el deber de cuidado.
Para los directorios, el punto central es aceptar que la autonomía necesita fricción. La promesa original de la IA fue acelerar procesos y reducir costos. La etapa que viene exigirá algo menos vistoso, pero más determinante. Registrar decisiones, limitar permisos, detectar desviaciones en tiempo real y cortar cadenas de error antes de que lleguen al cliente, al balance o al regulador.
El 1% de error no asusta por su rareza. Preocupa porque, en una organización automatizada, puede actuar miles de veces antes de aparecer en un reporte. Allí está la diferencia entre una falla técnica y una crisis corporativa. La primera se corrige con soporte. La segunda golpea reputación, caja y responsabilidad del directorio.






