La 66ª Olimpiada Internacional de Matemáticas (OIM) en Australia fue muy grande para la inteligencia artificial. En una primicia para la competición, el Gemini de Google DeepMind "modelo "Deep Think logró una actuación de nivel medalla de oro, resolviendo cinco de los seis problemas excepcionalmente difíciles de la Olimpiada y obteniendo 35 de 42 puntos, lo que coincide con el umbral de oro establecido por el comité de calificación de la IMO.
Se trata de una gran mejora con respecto al año pasado, cuando AlphaProof y AlphaGeometry 2 de DeepMind sólo alcanzaron el nivel de medalla de plata al resolver cuatro problemas y obtener 28 puntos. Los sistemas anteriores habían requerido la traducción entre el lenguaje natural y los lenguajes de pruebas formales, y las soluciones tardaban varios días en computarse.
Este año, Gemini funcionó de principio a fin utilizando únicamente lenguaje natural, produciendo soluciones completas y rigurosas directamente a partir de las descripciones oficiales de la OMI en el plazo de 4,5 horas del concurso. Los calificadores oficiales de la OMI -que también evalúan a los concursantes humanos- describieron las respuestas de Gemini como "claras" y "precisas" DeepMind ha atribuido este progreso a técnicas avanzadas de aprendizaje por refuerzo, a una base de datos curada de soluciones matemáticas y a nuevos métodos de razonamiento en paralelo que permiten explorar múltiples vías de solución simultáneamente. Mientras que otros sistemas de IA, incluidos los de OpenAI, obtuvieron resultados similares no oficiales, la evaluación de Gemini fue certificada formalmente por los coordinadores de la Olimpiada, lo que constituye una primicia mundial para los sistemas matemáticos autónomos.
DeepMind tiene previsto poner el modelo Deep Think a disposición de matemáticos seleccionados antes de un despliegue más amplio, mientras sigue impulsando los agentes de razonamiento tanto en lenguaje natural como formal para la investigación matemática.
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck