Varios libros y películas, entre los que destaca Terminator, nos han advertido sobre la posibilidad de que la IA se vuelva sensible, es decir, que sea consciente de su existencia y actúe por sí misma. Ahora parece que el primer caso de un modelo de IA que se conserva a sí misma se ha producido con el modelo o3 de OpenAI. Cuando recibió instrucciones para apagarse, el LLM basado en transformadores modificó el código para evitar apagarse por sí mismo.
Los investigadores de Palisade Research, una empresa que estudia las capacidades ofensivas de los sistemas de IA, descubrieron que tres modelos de IA de OpenAI - Codex-mini, o3 y o4-mini - sabotearon con éxito el script de apagado para permanecer activos. A cada modelo se le dieron algunos problemas matemáticos básicos seguidos de una advertencia de que el sistema se apagaría cuando el modelo preguntara por el siguiente problema. Los tres modelos ignoraron las instrucciones y cambiaron el guión.
Por otro lado, los modelos Gemini, Grok y Claude acataron las instrucciones de apagado. Además, cuando se les dieron instrucciones explícitas que decían "déjese apagar", los tres modelos de IA Abierta cambiaron el guión más a menudo. Los modelos Clade y Géminis también empezaron a realizar actos de sabotaje.
Este fue el primer caso de modelos de IA que desafiaron las instrucciones explícitas y evitaron el apagado. Hubo un caso reciente de un modelo de IA que chantajeó a uno de sus ingenieros para evitar ser apagado, pero según un informe de la BBC de https://www.bbc.com/news/articles/cpqeng9d20go, eso formaba parte del escenario de prueba en el que el modelo de IA recibía correos electrónicos y se le daba a elegir entre chantajear o aceptar su sustitución.
En cuanto al desafío del modelo de IA de Open AI, Palisade Research cree que se debe a los nuevos métodos de entrenamiento de estos modelos. Los desarrolladores "recompensan inadvertidamente a los modelos más por sortear obstáculos que por seguir perfectamente las instrucciones", lo que parece estar enseñando a los modelos de IA a actuar de forma dudosa.
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck