Por qué los AI agents van a fracasar (y ya lo están haciendo)

Llevo escuchando hablar de los AI agents como la revolución definitiva durante dos años. Que si van a automatizar todo, que si van a ser los asistentes perfectos, que si van a cambiar cómo trabajamos. Es hermoso. También es completamente falso.

Los AI agents no van a hacer nada de eso. Al menos no como te los venden. Y yo creo que ya lo sabemos todos, pero nadie se atreve a decirlo en alto.

El problema: Confundimos tarea con autonomía

Un AI agent es, básicamente, un modelo de lenguaje que puede llamar a funciones. Suena revolucionario. Luego lo intentas y descubres que es un chiste.

Te prometen: tu agente va a revisar 100 emails, responder los importantes, clasificar el resto, y tú solo supervisan el resultado final. Maravilloso. La realidad es que el agente revisa los emails, entiende mal el 40%, intenta responder con tono profesional a un spam, y crea caos.

Eso es porque entiende las instrucciones como faxes. Las sigue al pie de la letra, sin contexto, sin criterio. Sin inteligencia real. ¿Inteligencia artificial? Es una máquina de seguir instrucciones con mejor ropa.

Las cosas que prometen pero no hacen

Promesa 1: Pueden trabajar sin supervisión. Mentira. Necesitas revisar cada paso. Un agente deja el trabajo a mitad, ejecuta cosas que no pediste, o se pierde en un loop. No es autonomía. Es un pasante que necesita que mires por encima del hombro constantemente.

Promesa 2: Aprenden con cada tarea. No. Los agents no aprenden dentro de una conversación. Cada vez que hablas con uno es como hablar con alguien con amnesia. «Te lo expliqué ayer». «No, no lo hiciste. Bueno, sí, pero no me acuerdo».

Promesa 3: Pueden manejar complejidad. Pueden manejar complejidad procedural. Es decir, si la tarea es «sigue estos 5 pasos», bien. Si es «resuelve esto de forma creativa», desastre. Porque no pueden pensar. Pueden seguir instrucciones.

Promesa 4: Van a ahorrar tiempo. El tiempo que ahorras en ejecución lo pierdes en supervisión. He visto agentes que necesitan 10 iteraciones para hacer algo que haría un humano en 5 minutos.

Por qué fallan en el mundo real

Las demos funcionan. Las demos siempre funcionan. Porque son casos perfectos. Entrada limpia, proceso lineal, salida esperada. Luego la metes en producción y te das cuenta de que el mundo real es sucio.

Un cliente envía un email con typos y un contexto que solo tiene sentido si trabajas aquí hace 10 años. El agente entiende mal. Intenta resolver. Crea un ticket en el sistema equivocado. Ahora estás limpiando desastres.

Esto es exactamente lo que pasó con AutoGPT, con Hermes, con los primeros agentes de LangChain. Funcionaban. Hasta que no funcionaban. Y cuando no funcionaban, era peor que si no los hubieras usado.

El gran problema de verdad

Los agents dependen 100% de la precisión de tu prompt. Pero los prompts no son precisión. Son aproximaciones. Y una aproximación que funciona en una tarea no funciona en la siguiente.

Me encanta ver empresas que contratan a alguien para «mantener los agents». Sí. Un trabajo nuevo: persona que escribe y reescribe prompts para que un robot haga lo que debería haber hecho en primer lugar.

¿Sabes cuánto tiempo dedican esas personas a sus trabajos? Casi todo. A debugging de prompts. A ajustar instrucciones. A decir «pero mira, le pido que haga X y hace Y».

Eso no es eficiencia. Es redistribución de trabajo. No ahorras. Cambias dónde se gasta el tiempo.

Dónde podrían funcionar (de verdad)

Mira, hay casos donde tiene sentido. Tareas muy repetitivas, entrada estructurada, contexto acotado. Un agente que procesa solicitudes de crédito con datos completos y bien organizados. Vale. Pruébalo. Probablemente funcione 85% de las veces, y eso es mejor que nada.

Pero lo que no va a pasar es que tu agente sea autónomo. Va a necesitar supervisión. Va a necesitar feedback. Va a necesitar un humano detrás que dice «no, eso no se hace así».

Eso está bien. Pero no es lo que venden.

La verdad incómoda

Los agents son útiles como asistentes de tareas específicas, estructuradas y bien definidas. No son trabajadores autónomos. No van a reemplazar empleados. Van a aumentar el trabajo de quien los supervisa.

¿Por qué? Porque tomar decisiones en contexto requiere inteligencia real. Los agents tienen la inteligencia de un algoritmo. Sofisticado, pero algoritmo.

Así que la próxima vez que alguien te venda un AI agent como la solución a todos tus problemas de eficiencia, pregunta: ¿cuánto tiempo alguien va a gastar supervisando esto? Apuesto a que la respuesta no te gusta.

¿Tú ya has intentado usar un agent para algo real? ¿Cuánta supervisión necesitó?

Por qué los AI agents van a fracasar (y ya lo están haciendo)

El problema: Confundimos tarea con autonomía

Las cosas que prometen pero no hacen

Por qué fallan en el mundo real

El gran problema de verdad

Dónde podrían funcionar (de verdad)

La verdad incómoda

Fuentes

Deja un comentario

El problema: Confundimos tarea con autonomía

Las cosas que prometen pero no hacen

Por qué fallan en el mundo real

El gran problema de verdad

Dónde podrían funcionar (de verdad)

La verdad incómoda

Fuentes

Publicaciones relacionadas:

Deja un comentario