Anthropic ha lanzado Claude Sonnet 4.5, su última IA con un rendimiento de codificación mejorado diseñado para ayudar mejor a los desarrolladores de software a codificar aplicaciones.
Sonnet 4.5 obtiene buenos resultados en varios de los principales bancos de pruebas de codificación de IA, como SWE-bench y Terminal-Bench. La IA tiene una capacidad mejorada para utilizar herramientas informáticas con el fin de realizar tareas de forma autónoma, como se aprecia en su resultado líder del benchmark OSWorld lo que le permite crear un clon funcional del sitio web claude.ai por sí sola.
Las capacidades mejoradas de la IA le permiten responder a preguntas en los campos financiero, jurídico, médico y STEM mejor que los modelos anteriores de Anthropic, pero Claude Sonnet 4.5 sólo consigue puntuar entre una C y una D al responder a este tipo de preguntas. También obtiene malos resultados en tareas de razonamiento visual durante la prueba de referencia MMMU prueba frente a otros modelos de IA.
Los piratas informáticos querrán seguir con otros modelos de IA para hacer cosas malas como llevar a cabo ataques de inyección de prompt porque Sonnet 4.5 tiene la tasa de éxito más baja entre todos los modelos de IA probados.
Los usuarios que disfrutan de una charla picante con la IA encontrarán decepcionante el último Claude debido a su reducida tasa de hablar espontáneamente sobre espiritualidad. El modelo también expresa positividad sobre sí mismo con menos frecuencia, lo que hace que la conversación sea más aburrida.
Los lectores interesados en chatear con Claude Sonnet 4.5 pueden descargar la aplicación para smartphones aquí o acceder a la IA en la página web de Anthropic. Aquellos que realmente pongan a trabajar a la IA pueden utilizar una Nota Plaud para poner a Claude a trabajar resumiendo y transcribiendo reuniones de pie.
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck