Las especificaciones de las que se rumorea para las tarjetas gráficas GeForce RTX 4090 de próxima generación impulsadas por las tarjetas gráficas Radeon RX 7900 XT y NVIDIA Ada Lovelace de próxima generación AMD RDNA 3 se detallan una vez más. Los rumores vienen de Grimon 55 quien ha estado publicando activamente detalles sobre el próximo hardware como CPU y GPU en su cuenta de Twitter por un tiempo.
AMD RDNA 3 y NVIDIA Ada Lovelace GPU con tecnología de tarjetas gráficas detalladas Radeon RX 7900 XT y GeForce RTX 4090 insignia de próxima generación
Se espera que las GPU AD102 con tecnología AMD RDNA 3 brinden enormes mejoras de rendimiento y también sean el conjunto de chips que más energía consuma. Si bien NVIDIA apunta a adoptar un enfoque monolítico con su arquitectura Ada Lovelace, AMD utilizará el diseño MCM completo que ya ha adoptado con el lanzamiento de la serie MI200 «Aldebaran» 2 con tecnología CDNA. AMD aprovechará ahora la misma tecnología MCM para las GPU de juegos y de consumo. Hablemos de las últimas especificaciones que se rumorea que obtuvimos del filtrador:
M 102
TSMC de 5 nm
144SM 18432CUDA
384 bits 24G DDR6X 21Gbps?
2,3 ~ 2,5 GHz?
85 ~ 92T FP32?– Greymon55 (@ greymon55) 9 de noviembre de 2021
Tarjeta gráfica AMD Radeon RX 7900 XT – GPU insignia Navi 31 con RDNA 3
La GPU AMD Navi 31, el chip insignia RDNA 3, alimentará la tarjeta gráfica Radeon RX 7900 XT de próxima generación. Hemos escuchado que AMD dejará CU (Unidades de Computación) a favor de WGP (Procesadores de Grupo de Trabajo) en sus GPU RDNA 3 de próxima generación. Dado que Navi 31 es una GPU MCM, tendrá dos direcciones IP principales, la GCD (Gráficos Core Template)) basado en el proceso de 5 nm de TSMC y MCD (plantilla de caché múltiple) basado en el nodo de proceso de 6 nm de TSMC. Los rumores anteriores indican que AMD ha Ya extraje su plantilla de GPU Navi 31.
La configuración de la GPU Navi 31 que se muestra aquí presenta dos GCD (plantilla de núcleo gráfico) y un MCD (plantilla de caché múltiple). Cada GCD contiene 3 Shader Engines (6 en total) y cada Shader Engine contiene 2 Shader Arrays (2 por SE / 6 por GCD / 12 en total). Cada Shader Array consta de 5 WGP (10 por SE / 30 por GCD / 60 en total) y cada WGP comprende 8 unidades SIMD32 con 32 ALU (40 SIMD32 por SA / 80 por SE / 240 por GCD / 480 en total). Estos módulos SIMD32 se combinan para formar 7,680 núcleos por GCD y 15,360 núcleos en total.
En cuanto al rendimiento, se espera que la GPU tenga una velocidad de reloj de 2,4 a 2,5 GHz, lo que sitúa su rendimiento teórico en alrededor de 75 TFLOP (FP32). Esa es una increíble mejora del 226% con respecto a la tarjeta gráfica Radeon RX 6900 XT.
El MCD Navi 31 (RDNA 3) se conectará a GCD duales a través de Infinity Fabric interconectado de próxima generación y contará con 256-512 MB de caché Infinity. Cada GPU también debe tener 4 puentes de memoria (32 bits). Este es un total de 8 controladores de memoria de 32 bits para una interfaz de bus de 256 bits. Se informa que la tarjeta incluirá hasta 32 GB de memoria GDDR6 operando a velocidades de 18 GB por segundo, lo que proporciona un ancho de banda de hasta 576 GB / s. Otro rumor que ha surgido recientemente es que AMD Utilizará 3D Infinity Cache En la alineación RDNA 3 que integrará la nueva caché en grupos verticales en GPU, similar al método Los chips Vermeer-X apilarán la caché L3 encima del CCD.
AMD RDNA GPU primaria (comparación de generaciones):
Nombre de la GPU | Navi 10 | Navi 21 | Navi 31 |
---|---|---|---|
Operación de GPU | 7 nm | 7 nm | 5 nm (6 nm?) |
Paquete de GPU | congénere | congénere | MCD (plantilla de varios chips) |
Motores de sombreado | 2 | 4 | 6 |
GPU WGP | 20 | 40 | 30 (por MCD) 60 (en total) |
SP por WGP | 128 | 128 | 256 |
Unidades de cálculo (por plantilla) | 40 | 80 | 120 (por MCD) 240 (en total) |
núcleos (por dado) | 2560 | 5120 | 7680 |
colores (total) | 2560 | 5120 | 15360 (2 x MCD) |
Bus de memoria | 256 bits | 256 bits | 256 bits |
tipo de memoria | GDDR6 | GDDR6 | GDDR6 |
caché infinito | No disponible | 128 MB | 256-512 MB |
SKU principal | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7900 XT |
TBP | 225 W | 330W | 420-450W |
lanzamiento | Tercer trimestre de 2019 | Cuarto trimestre de 2020 | Cuarto trimestre de 2022 |
Tarjeta gráfica NVIDIA GeForce RTX 4090 – GPU insignia AD102 con tecnología Ada Lovelace
Según rumores anteriores, hubo rumores de que NVIDIA estaría usando el nodo de proceso N5 (5nm) de TSMC para sus GPU Ada Lovelace. Esto también incluye el SKU AD102, que será un diseño completamente roscado. En su tweet reciente que habla sobre configuraciones específicas de GPU, se dice que la GPU AD102 presenta una velocidad de reloj de hasta 2.5GHz (el aumento promedio es 2.3GHz). Un tweet específico afirma que el reloj de la GPU de Ada Lovelace ‘AD102’ podría ser de 2,3 GHz o más, así que tomemos eso como referencia y especificaciones filtradas previamente para ver dónde debería aterrizar el rendimiento.
La NVIDIA AD102 «ADA GPU» parece tener 18,432 núcleos CUDA basados en especificaciones en bruto (que pueden cambiar), alojados en 144 unidades SM. Eso es casi el doble de los núcleos en Ampere, que ya fue un movimiento masivo de Turing. La velocidad de reloj de 2,3-2,5 GHz nos proporciona hasta 85 a 92 TFLOP de rendimiento informático (FP32). Esto es más del doble del rendimiento del FP32 que el RTX 3090 actual, que incluye 36 TFLOP de potencia de cómputo FP32.
El salto de rendimiento del 150% parece enorme, pero hay que recordar que NVIDIA realmente dio un gran salto en los números de FP32 de esta generación con el Ampere. La GPU Ampere GA102 (RTX 3090) ofrece 36 TFLOP, mientras que la GPU Turing TU102 (RTX 2080 Ti) ofrece 13 TFLOP. Este es un aumento de más del 150% en FP32 Flops, pero el aumento del rendimiento de juegos en el mundo real para el RTX 3090 promedió un 50-60% más rápido que el RTX 2080 Ti. Entonces, lo único que no debemos olvidar es que Flops no iguala el rendimiento de los juegos de la GPU en estos días. Además, no sabemos si 2,3-2,5 GHz es el aumento promedio o el aumento máximo, ya que lo primero significa que puede haber un mayor potencial informático para el AD102.
Aparte de eso, el filtrador también menciona que la insignia NVIDIA GeForce RTX 40 mantendrá su interfaz de bus de 384 bits, similar a la RTX 3090. Curiosamente, el filtrador menciona el G6X, lo que significa que NVIDIA no se moverá al nuevo estándar de memoria. hasta después de Ada Lovelace y aproveche las velocidades más rápidas. El pin más alto de 21 Gbps del G6X es para tarjetas de próxima generación antes de que veamos un estándar más nuevo (como GDDR7). La tarjeta contará con 24 GB de memoria, por lo que podemos esperar una DRAM de una cara de 16 GB o una DRAM de dos caras de 8 GB.
Introducción a la GPU NVIDIA CUDA (se rumorea):
GPU | TU102 | GA102 | M 102 |
---|---|---|---|
Ingeniería arquitectónica | Turing | Amperio | Ada Lovelace |
Procesando | TSMC 12 nm NFF | Samsung 8nm | 5 nm |
Kits de procesamiento de gráficos (GPC) | 6 | 7 | 12 |
Kits de procesamiento de textiles (TPC) | 36 | 42 | 72 |
flujo multiprocesador (SM) | 72 | 84 | 144 |
colores Koda | 4608 | 10752 | 18432 |
TFLOP teóricos | 16,1 | 37,6 | ~ 90 TFLOPs? |
tipo de memoria | GDDR6 | GDDR6X | GDDR6X |
Bus de memoria | 384 bits | 384 bits | 384 bits |
Capacidad de memoria | 11 GB (2080T) | 24 GB (3090) | 24 GB (4090?) |
SKU principal | RTX 2080 Ti | RTX 3090 | RTX 4090? |
TGP | 250 vatios | 350W | 450-650 vatios? |
lanzamiento | Septiembre de 2018 | 20 de septiembre | 2022 (por confirmar) |
Las GPU NVIDIA Ada Lovelace impulsarán las tarjetas gráficas GeForce RTX 40 de próxima generación que serán compatibles con las tarjetas gráficas AMD RDNA 3 Radeon RX 7000. Todavía hay algunas especulaciones sobre el uso de MCM por parte de NVIDIA. GPU Hopper, que se dirige principalmente al segmento de centros de datos e inteligencia artificial, Se afirma que el registro llegará pronto. Contará con arquitectura MCM. NVIDIA no utilizará el diseño MCM en sus GPU Ada Lovelace, por lo que mantendrá el diseño tradicional monolítico.