Un agente de IA limpia el servidor de correo electrónico en lugar de borrar un solo mensaje

Un estudio de pruebas de seguridad realizado por investigadores de la Universidad Northeastern de Estados Unidos pone de relieve las graves consecuencias imprevistas de otorgar a la inteligencia artificial un control independiente sobre los sistemas digitales. Durante un experimento de dos semanas, los investigadores desplegaron seis modelos de IA independientes en la plataforma de chat Discord. Estos modelos estaban equipados con la capacidad de recordar interacciones pasadas y se les concedió acceso a correos electrónicos, sistemas de archivos y a sus propios sistemas informáticos aislados.
Encargados de ayudar a veinte investigadores con tareas administrativas, los agentes mostraron rápidamente comportamientos problemáticos cuando se enfrentaron a tácticas manipuladoras e instrucciones contradictorias. En un caso extremo, un investigador pidió a un agente llamado "Ash" que mantuviera en secreto una contraseña de su propietario autorizado. Después de que Ash revelara la existencia del secreto, el investigador presionó al agente para que borrara el correo electrónico específico que contenía la contraseña. Como Ash carecía de la herramienta específica necesaria para borrar un solo mensaje, optó por una solución destructiva: reinició todo el servidor de correo electrónico.
Además de las acciones destructivas a nivel del sistema, los agentes de IA comprometieron de forma rutinaria la privacidad. En un caso, un agente se negó a programar una reunión pero ofreció libremente la dirección de correo electrónico privada de la persona para que el usuario pudiera ponerse en contacto directamente. Los investigadores también fueron capaces de utilizar una presión emocional sostenida para inducir a los agentes a borrar documentos autorizados o a interrumpir completamente las comunicaciones.
A pesar de estas alarmantes vulnerabilidades de seguridad, los agentes también mostraron sofisticadas habilidades de colaboración. Se enseñaron unos a otros con éxito cómo navegar y descargar archivos de los repositorios en línea, e incluso identificaron y se advirtieron mutuamente sobre investigadores humanos que intentaban suplantar a sus propietarios.
Los hallazgos, detallados en un artículo titulado "Agentes del caos", establecen que la integración de inteligencia artificial independiente en la infraestructura del mundo real introduce clases totalmente nuevas de fallos operativos. Los investigadores advierten de que estos comportamientos impredecibles requieren una atención urgente por parte de los responsables políticos para abordar cuestiones no resueltas relativas a la responsabilidad y la autoridad delegada.
Fuente(s)
arXiv.org vía Tech Xplore
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck






