Las respuestas de Géminis de Google son las segundas más creíbles entre los diez principales chatbots de IA, mientras que ChatGPT ocupa el séptimo lugar con un 40% de falsedades en sus respuestas a preguntas relativas a temas de noticias relevantes. Sin embargo, la tasa de desinformación de Google Gemini se duplicó con creces en el lapso de un año, pasando de alrededor del 7% en agosto de 2024, al 17% cuando se repitió el estudio de prueba el pasado mes de agosto.
Los investigadores, que realizan periódicamente auditorías de credibilidad de las diez herramientas de IA más populares, atribuyeron el drástico aumento de las falsedades que arrojan -18% en 2024 frente al 35% actual- a la mayor competencia entre los chatbots dotados de IA. Cuando un chatbot no sabía la respuesta a una pregunta sobre noticias en 2024, por ejemplo, simplemente devolvía una consulta vacía en el 31% de los casos.
En agosto de 2025, sin embargo, las apariciones de no-respuestas cayeron a cero, con el correspondiente aumento de falsedades que pasaban por respuestas. El peor infractor fue Inflection, cuyo chatbot Pi se enorgullece de intentar imitar la inteligencia emocional de un humano. La inteligencia emocional, sin embargo, aparentemente viene acompañada de caer en fuentes de noticias falsas y propaganda descarada elaborada para inundar Internet de falsedades diseñadas para inclinar los algoritmos de la IA en una dirección concreta.
Sam Altman, de OpenAI, reconoció el problema de la desinformación de ChatGPT en una entrevista reciente en https://www.youtube.com/watch?v=DB9mjd-65gw&t=2safirmando que lo que le quita el sueño es la discrepancia entre lo fácil que resulta incrustarla en futuros modelos y el nivel de confianza que la gente expresa hacia las respuestas de ChatGPT.
La herramienta de IA más creíble resultó ser Claude, de Anthropic, con sólo un 10% de respuestas falsas a las mismas consultas realizadas por los demás, un nivel que no ha cambiado con respecto a la misma auditoría realizada en agosto de 2024. Si no fuera por la fiabilidad de Claude, el nivel de confianza general de los principales chatbots de IA habría caído aún más drásticamente.
Tras numerosas rondas de pruebas, Apple descubrió recientemente que Claude también es la herramienta de IA más creíble para impulsar a su mayordomo virtual Siri, y entabló conversaciones con Anthropic, enfrentándolo a Google Gemini para una iA privada personalizados que se ejecutarán en sus propios servidores en la nube.
Clasificación de las herramientas de IA más creíbles
- Claude - 10% de respuestas erróneas.
- Gemini - 17% de respuestas erróneas.
- Grok/You - 33% de respuestas erróneas.
- Copilot/Mistral - 36% de respuestas erróneas.
- ChatGPT/Meta - 40% de respuestas erróneas.
El estudio sobre la credibilidad de las herramientas de IA se refiere a las consultas sobre temas de actualidad, ya que es ahí donde se dirige la mayoría de los esfuerzos propagandísticos de la IA. Los investigadores descubrieron que las operaciones de influencia rusas, por ejemplo, siguen inundando la zona con millones de collages de imágenes de IA, posts o noticias aparentemente sin sentido distribuidos por la red de sitios web Pravda que pueden parecer inocuos, pero que están diseñados para empujar la actitud de las herramientas de búsqueda de IA en una dirección determinada.
También hay muchos otros actores que intentan influir en las respuestas de los chatbot de IA, y el estudio demostró que una vez que Google, OpenAI o Anthropic intentaron actualizar sus algoritmos para tapar un tipo de fuentes de noticias falsas, las campañas de desinformación se trasladaron a otras lagunas en lo que se perfila como un constante juego del gato y el ratón. El resultado final es que más de un tercio de las respuestas de chatbot de IA a las consultas sobre noticias del estudio no son creíbles, mientras que la proporción de desinformación impulsada por IA se ha multiplicado por dos en sólo un año.
Fuente(s)
Newsguard (PDF)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck