Nvidia ha anunciado su arquitectura computacional de IA Rubin de próxima generación, que por fin estará a la altura de la estrategia de IA de China para ejecutar la inferencia de IA a un coste mucho menor que la actual edición Blackwell.
Al igual que el Nvidia Rubin AI sugerían los rumores, la plataforma se construye en torno a seis subsistemas de procesamiento que trabajan juntos: la CPU Vera, la nueva GPU Nvidia Rubin, el conmutador NVLink 6 de tercera generación, la SuperNIC ConnectX-9, la DPU BlueField-4 y el conmutador Ethernet Spectrum-6. Los chips están construidos sobre nodos de fundición avanzados de TSMC e introducen optimizaciones de interfaz dirigidas a una reducción drástica de los costes de los tokens y de la duración de la formación.
De hecho, el "codiseño" de Nvidia en los seis nuevos chips permite el entrenamiento de modelos con una cuarta parte de las GPU necesarias en la actual plataforma Nvidia Blackwell y reduce diez veces los costes por token. Una disminución de diez veces en los costes por token es lo que Elon Musk está prometiendo para la próxima generación de Tesla AI5 de Tesla; sólo que no entrará en producción en masa antes del año que viene. Elon Musk elogió a Nvidia Rubin como el "motor cohete para la IA" que permitirá el despliegue de modelos de borde a escala.
China también se enorgullece del bajo Precio de los tokens de IA que consigue mediante modelos de código abierto como DeepSeek y encadenando un montón de GPU de IA de gama media como la Huawei 910C juntas, por lo que la arquitectura Rubin de Nvidia por fin hace algo para abordar no sólo el rendimiento sino también los costes de ejecución de los modelos de IA.
Quizá la parte más interesante de la plataforma Rubin sea la nueva CPU Nvidia Vera,"diseñada para el movimiento de datos y el razonamiento agéntico a través de sistemas acelerados, con soporte completo de computación confidencial" Puede emparejarse con una GPU Nvidia o funcionar como procesador independiente ejecutando"cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC)" con total compatibilidad con Arm.
Las especificaciones de la CPU Vera incluyen 88 núcleos personalizados y 1,2 TB/s de ancho de banda de memoria LPDDR5X y presentan un consumo energético muy frugal. La integración de la interfaz de conectividad NVLink-C2C ejecuta el acceso sincronizado a la memoria CPU-GPU como parte de las características de optimización que hacen que la plataforma Rubin sea un orden de magnitud más eficiente que su predecesora basada en Blackwell.
Consiga el superordenador personal de IA Nvidia DGX Spark en Amazon
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck






