OpenAI ha presentado GPT-5.5 como un salto hacia una IA más autónoma y con menos supervisión humana en tareas largas, según recogen medios como El Español en su cobertura del anuncio. La narrativa es la de siempre: menos fricción, más “intuición” y capacidad de encadenar pasos sin que tengas que microgestionar cada coma del prompt. Yo te lo creo a medias: el avance técnico puede ser real, pero el desfase entre el relato del lanzamiento y lo que ves en una pyme o en un departamento pequeño de sistemas sigue siendo abismal.
Mientras tanto Google empuja Gemini Enterprise como plataforma para desplegar agentes de IA en la empresa, como explica El Periódico. No estoy diciendo que sean lo mismo; lo que me choca es el patrón: todos los actores te venden orquestación, gobierno y “escala” en el mismo mes en que tú aún estás enseñando a tu equipo a no pegar datos sensibles en el chat de turno. La competencia entre gigantes te beneficia en demos y en trials; no te resuelve el caos de permisos, ni el consentimiento, ni el soporte cuando algo falla en producción un viernes a las 18:00.
En paralelo, el análisis de ESET (WeLiveSecurity) sobre los retos de la IA generativa sigue sonando incómodamente actual: gobernanza, privacidad, calidad de lo generado, dependencia de proveedores. Es decir, exactamente lo que no cabe en un titular de rueda de prensa. Un modelo “más intuitivo” puede reducir la fatiga de redacción; no sustituye una política clara de uso, un inventario de datos y criterios de aceptación si integras la IA en un flujo con clientes. Si no pones eso, lo intuitivo pasa a ser el atajo que filtra lo que no debía y nadie sabe a quién escalar. Ese es un ejemplo de carga que el marketing no pesa.
Entonces, qué hago yo con una noticia como GPT-5.5. Primero, separo capacidad y responsabilidad. Segundo, miro el coste total: licencias, formación, revisión humana y el tiempo de quien arregla cuando el agente alucina en un documento que va firmado. Tercero, miro el proveedor: no por fanatismo, sino por contrato, salida, retención de datos y trazabilidad. Si en tu cabeza suena a burocracia, bien: en escala pequeña la burocracia es a veces el único firewall que te queda.
Si hoy estás probando asistentes o agentes, no te dejes llevar por la lista de benchmark que suelen citar en la prensa especializada. Pregúntate si tu caso requiere autonomía real o simplemente un asistente de borrador con dos plantillas aprobadas. A veces la segunda opción te ahorra meses de incidentes, y a tu gente de RR.HH. un disgusto que no te compensa ninguna demo.
¿A qué cierro? A que mires lo nuevo con ojo de comprador, no de impresionable. Y a una pregunta concreta: si tuvieras que elegir entre un proveedor cuyo modelo publicita “más autonomía” y otro que te da menos fuegos artificiales pero trazabilidad y soporte en castellano con SLA claro, cuál probarías en un piloto con datos reales y por qué.