En la Conferencia GTC 2025 de San José de California en California el martes, el CEO Jensen Huang Reveló Muchos GPU de la Restructuración de AI planea lanzar los próximos meses y años. También expresó especificaciones adicionales sobre los chips anunciados previamente.
El aviso central es Vera Rubin, Primero burlado El ComputerX ahora está programado para ser lanzado en la segunda mitad del año 2024. Esta GPU lleva el nombre El famoso astrónomoLa vera con la CPU diseñada por la Nvidia personalizada, que presenta decenas de miles de memoria de terabita.
Según Nvidia, Vera Rubin proporcionará mejoras de rendimiento significativas que sus predecesores, Grace BlackwellEspecialmente para el entrenamiento y la suposición de IA.
Especificaciones para Vera Rubin, Jensen Huang presentó su discurso principal GTC 2025.
Vera Rubin tiene dos GP juntos en One Death, que proporciona 50 betaplapps del rendimiento de la suposición de FP 4 para un chip. Cuando se configura todo el rack ENVL 144, el sistema ofrece 3.6 Exoflapps de la suposición FP4: un bastidor similar es 3.3 veces más que el 1.1 Exofflops de Blackwell Ultra.
La CPU de Vera tiene 88 bobinas de manos personalizadas, y 176 textos están conectados a la interfaz NVL de 1,8 tb/v de alta velocidad con Rubin GPS.
Huang también anunció Rupin Ultra en la segunda mitad de 2027. Se usa rack Rubin Ultra NVL 576 y el GP individual está en el centro de atención con cuatro muertes de tamaño reddic.
En el nivel de la rejilla, el Rubin Ultra FB4 es cuatro veces más potente que la configuración Rubin NVL 144 de las computadoras concluyentes Rubin Ultra FB4 y 5 ExcaplopP del rendimiento de entrenamiento FB8. Cada Rubin Ultra GPU tendrá una memoria HBM4E de 1 TB, un estante completo con memoria rápida de 365 tb.