Nueva fuga: La GPU de cálculo Radeon Instinct MI100 de AMD es más de 100% más rápida comparada con la GPU A100 Amperios de Nvidia en cargas de trabajo de FP32

Se espera que la GPU de cálculo MI1000 Instinct se lance este diciembre. (Fuente de la imagen: Videocardz)

Anteriormente se creía que era bastante inferior a la GPU de cálculo de Nvidia A100 Ampere, pero ahora se espera que el próximo MI100 Instinct de AMD sea mucho más rápido que la competencia en ciertas cargas de trabajo. El MI100 será la primera GPU de cálculo desarrollada en la arquitectura CDNA y se lanzará este diciembre, apuntando a aplicaciones de aprendizaje HPC/AI/máquina para los sectores del petróleo/gas y académico.

Bogdan Solca, Publicado 07/30/2020 🇺🇸 🇫🇷 ...

AMD Desktop

En febrero de 2020, las primeras filtraciones de la GPU de cálculo AMD MI100 Instinct, con nombre en código Arcturus, afirmaban que el próximo procesador de cálculo de alto rendimiento de AMD obtendría 32 GB de memoria HBM2, pero que toda esa VRAM no significaría mucho porque las frecuencias centrales que se rumoreaban parecían demasiado bajas. Por lo tanto, el rendimiento esperado para la próxima GPU MI100 parecía estar en algún lugar entre un RTX 2080 Super y un RTX 2080 Ti. Gracias a una nueva filtración publicada por Adored TV, ahora tenemos una mejor comprensión de cómo la GPU MI100 puede funcionar, y parece que las primeras filtraciones se apagaron por un margen significativo.

Adored TV reitera que el MI100 obtendrá 32 HBM2 VRAM con ECC resultando en un ancho de banda de 1,2 TB/s, pero el número de unidades de cálculo ahora parece ser de 120. No estamos seguros de que la arquitectura del CDNA sea similar a la del RDNA en lo que respecta al número de núcleos por unidad de cálculo, así que si asumimos que el CDNA es similar al RDNA, 120 CU significaría 7680 núcleos. Sin embargo, el CDNA puede ser diferente y el número de núcleos podría ser mayor o menor. En cualquier situación, las especificaciones de rendimiento filtradas para la GPU MI100 parecen ser mucho más altas que incluso la GPU de cálculo A100 Ampere de Nvidia en la que se basan los modelos de GPU para juegos RTX 3000.

Según las diapositivas filtradas, el MI100 es más del 100% más rápido que el Nvidia A100 en cargas de trabajo FP32, con casi 42 TFLOPs de potencia de procesamiento frente a los 19,5 TFLOPs del A100. Fugas anteriores también afirmaban que el TGP estaba ajustado a 200 W, pero la última fuga muestra 300 W, lo que significa que los relojes del núcleo pueden claramente ser aumentados en una cantidad considerable. En este caso, el MI100 tiene 7680 núcleos funcionando a 2,75 GHz, o 15360 núcleos funcionando a ~1,37 GHz. Esta última configuración sería más probable a juzgar por los relojes más bajos, pero el número de núcleos parece demasiado alto.

También hay una diapositiva de características que menciona que el MI100 es de hecho mejor que el A100 cuando se trata de cargas de trabajo de precisión simple, pero esa sería la única ventaja de la GPU AMD. Las GPUs de cálculo del MI100 se dirigirán a aplicaciones de HPC, IA y aprendizaje de máquinas para los mercados del petróleo/gas y académicos. Además, aprendemos que la GPU de cálculo es compatible con las actuales CPU EPYC de Roma y Milán de AMD y con las CPU Xeon de Intel. AMD pretende lanzar dos configuraciones:

1U con 4 GPUs MI100 y 2 CPUs EPYC/Xeon que se espera estén disponibles en diciembre de este año

3U con 8x MI100 GPUs y 2 CPUs EPYC lanzadas en marzo de 2021.