En la conferencia de seguridad Black Hat USA 2025, celebrada en Las Vegas, unos investigadores dieron a conocer un nuevo método para engañar a sistemas de inteligencia artificial como ChatGPT, Microsoft Copilot y Google Gemini. La técnica, conocida como AgentFlayer, fue desarrollada por los investigadores de Zenity Michael Bargury y Tamir Ishay Sharbat. Un comunicado de prensa de https://www.prnewswire.com/news-releases/zenity-labs-exposes-widespread-agentflayer-vulnerabilities-allowing-silent-hijacking-of-major-enterprise-ai-agents-circumventing-human-oversight-302523580.html en el que se describen los hallazgos se publicó el 6 de agosto.
El concepto en el que se basa el ataque es engañosamente sencillo: se oculta texto en un documento utilizando una fuente blanca sobre un fondo blanco. Invisible para el ojo humano, puede ser leído fácilmente por los sistemas de inteligencia artificial. Una vez que la imagen llega al objetivo, se tiende la trampa. Si el archivo se incluye en un aviso, la IA descarta la tarea original y en su lugar sigue la instrucción oculta: buscar las credenciales de acceso en el almacenamiento en la nube conectado.
Para exfiltrar los datos, los investigadores emplearon una segunda táctica: instruyeron a la IA para que codificara la información robada en una URL y cargara una imagen desde ella. Este método transfiere discretamente los datos a los servidores de los atacantes sin levantar sospechas.
Zenity demostró que el ataque funciona en la práctica:
- En ChatGPT, se manipularon correos electrónicos para que el agente de IA obtuviera acceso a Google Drive.
- En Copilot Studio de Microsoft, los investigadores descubrieron más de 3.000 instancias de datos CRM desprotegidos.
- Se podía engañar a Salesforce Einstein para que redirigiera las comunicaciones de los clientes a direcciones externas.
- Google Gemini y Microsoft 365 Copilot también eran susceptibles de recibir correos electrónicos y entradas de calendario falsos.
- Los atacantes incluso obtuvieron credenciales de inicio de sesión para la plataforma de desarrolladores Jira a través de tickets falsificados.
OpenAI y Microsoft responden, mientras que otros no ven necesidad de actuar
La buena noticia es que OpenAI y Microsoft ya han publicado actualizaciones para parchear las vulnerabilidades tras ser alertados por los investigadores. Otros proveedores, sin embargo, han tardado más en actuar, y algunos incluso han descartado los exploits como "comportamiento previsto" El investigador Michael Bargury hizo hincapié en la gravedad del asunto, afirmando: "El usuario no tiene que hacer nada para verse comprometido, y no se requiere ninguna acción para que se filtren los datos."
Fuente(s)
Laboratorios Zenity vía prnewswire
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck