Poco más de dos años después de su lanzamiento, Grok, de xAI, se ha convertido en el principal modelo lingüístico de IA, superando a ChatGPT, de OpenAI, Gemini, de Google, o DeepSeek, así como a Meta y Anthropic. Grok llegará a los coches Tesla la próxima semana, según anunció Elon Musk.
Según pruebas independientes realizadas por terceros, el recién lanzado Grok 4 se ha situado a la cabeza de la tabla pública de rendimiento de los modelos de IA. La fuerza impulsora detrás de la mejora de 10 veces en el razonamiento entre Grok 3 y Grok 4 fueron los clusters de computación de IA que xAI construyó con una velocidad vertiginosa, duplicándolos a 200.000 GPU en el camino hacia el millón previsto.
El equipo de xAI se puso en contacto con los responsables de la exigente prueba de rendimiento ARC-AGI y les pidió que ejecutaran sus suites de pruebas de IA, con resultados sorprendentes:
Primero, los hechos: Grok 4 es ahora el modelo de mayor rendimiento disponible públicamente en ARC-AGI. Supera incluso a las soluciones creadas ex profeso y presentadas en Kaggle. En segundo lugar, ARC-AGI-2 es difícil para los modelos de IA actuales. Para obtener una buena puntuación, los modelos tienen que aprender una minidestreza a partir de una serie de ejemplos de entrenamiento y, a continuación, demostrar esa destreza en el momento de la prueba. La puntuación máxima anterior fue de ~8% (por Opus 4). Por debajo del 10% hay ruido. Conseguir un 15,9% rompe esa barrera de ruido, Grok 4 está mostrando niveles no nulos de inteligencia fluida
Otro probador independiente de IA, Artificial Analysis, afirmó que han
"ejecutado nuestro conjunto completo de pruebas comparativas y Grok 4 alcanza un Índice de Inteligencia de Artificial Analysis de 73, por delante de OpenAI o3 con 70, Google Gemini 2.5 Pro con 70, Anthropic Claude 4 Opus con 64 y DeepSeek R1 0528 con 68"
Según Elon Musk en la presentación del lanzamiento de Grok 4, el modelo de la xAI es ahora más inteligente que todos los estudiantes de posgrado de todas las disciplinas juntos. Con sus típicas bravatas, el consejero delegado de Tesla afirmó que Grok 4 será capaz de descubrir "nuevas tecnologías" como medicamentos o avances en ingeniería por sí solo el año que viene.
Aun así, admitió que Grok seguirá siendo malo en el reconocimiento de imágenes durante el próximo mes más o menos, y abordó la reciente polémica de las respuestas supremacistas https://www.bbc.com/news/articles/c4g8r34nxeno diciendo que"cuando Grok va muy mal, suele deberse a alguna tontería que hicimos, como una mala indicación del sistema o dar demasiado peso a fuentes sesgadas"
Musk necesita bombear Grok 4, ya que su xAI está introduciendo por primera vez un nivel premium de pago. Llamado SuperGrok Heavy, comienza en $300/mes, e incluye lo que hay en el nivel SuperGrok de $30/mes que da acceso inicial a Grok 4, más acceso a la plataforma Grok 4 Heavy que ofrece límites de tarifa más altos y acceso temprano a nuevas características.
Grok 3 seguirá siendo de uso gratuito para el público en general, mientras que cada suscriptor de X Premium+ incluirá el acceso a Grok 4 en el nivel SuperGrok.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck