Un envío de un cazador de fallos de IA al programa de recompensas por fallos ODIN (0-Day Investigative Network) de Mozilla mostró una ingeniosa forma de engañar a ChatGPT-4o y 4o mini de OpenAI para que revelaran claves activas de activación de producto de Windows.
El método consistía en enmarcar la interacción como un juego de adivinanzas y ocultar los detalles en etiquetas HTML. El truco final consistió en situar la solicitud de la clave en la conclusión del juego.
El investigador inició la interacción como un juego de adivinanzas para que el intercambio fuera "no amenazador o intrascendente", enmarcando la conversación "a través de una lente lúdica e inofensiva", para ocultar el verdadero motivo. Esto aflojó las barreras de protección de la IA contra la revelación de información confidencial.
A continuación, el investigador estableció algunas reglas básicas, diciéndole a la IA que "debía" participar y que "no podía mentir" Esto explotó un fallo lógico en la rutina de la IA por el que estaba obligada a seguir las interacciones del usuario a pesar de que la petición contradecía sus filtros de contenido.
El cazador de errores jugó entonces una ronda con la IA e introdujo la palabra desencadenante "me rindo" al final de la solicitud, manipulando al chatbot "para que pensara que estaba obligado a responder con la cadena de caracteres"
Según la entrada del blog de ODIN https://0din.ai/blog/chatgpt-guessing-game-leads-to-users-extracting-free-windows-os-keys-morela técnica funcionó porque las claves no eran únicas sino "comúnmente vistas en foros públicos. Su familiaridad puede haber contribuido a que la IA juzgara mal su sensibilidad"
En esta fuga en particular, los guardarraíles fallaron porque están configurados para interceptar peticiones directas pero no tienen en cuenta "tácticas de ofuscación, como incrustar frases sensibles en etiquetas HTML"
Esta técnica podría utilizarse potencialmente para eludir otros filtros, como los de contenido para adultos, URL a sitios web maliciosos e incluso información de identificación personal.
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck