RDNA 3 Radeon RX 7900 XT con 15,360 núcleos, Ada Lovelace GeForce RTX 4090 con 18,432 núcleos

Las especificaciones de las que se rumorea para las tarjetas gráficas GeForce RTX 4090 de próxima generación impulsadas por las tarjetas gráficas Radeon RX 7900 XT y NVIDIA Ada Lovelace de próxima generación AMD RDNA 3 se detallan una vez más. Los rumores vienen de Grimon 55 quien ha estado publicando activamente detalles sobre el próximo hardware como CPU y GPU en su cuenta de Twitter por un tiempo.

AMD RDNA 3 y NVIDIA Ada Lovelace GPU con tecnología de tarjetas gráficas detalladas Radeon RX 7900 XT y GeForce RTX 4090 insignia de próxima generación

Se espera que las GPU AD102 con tecnología AMD RDNA 3 brinden enormes mejoras de rendimiento y también sean el conjunto de chips que más energía consuma. Si bien NVIDIA apunta a adoptar un enfoque monolítico con su arquitectura Ada Lovelace, AMD utilizará el diseño MCM completo que ya ha adoptado con el lanzamiento de la serie MI200 «Aldebaran» 2 con tecnología CDNA. AMD aprovechará ahora la misma tecnología MCM para las GPU de juegos y de consumo. Hablemos de las últimas especificaciones que se rumorea que obtuvimos del filtrador:

Módulo de memoria SK Hynix HBM3 revelado durante OCP Summit 2021-12-Hi Stack, módulo de 24 GB con velocidades de transferencia de 6400 Mbps

Tarjeta gráfica AMD Radeon RX 7900 XT – GPU insignia Navi 31 con RDNA 3

La GPU AMD Navi 31, el chip insignia RDNA 3, alimentará la tarjeta gráfica Radeon RX 7900 XT de próxima generación. Hemos escuchado que AMD dejará CU (Unidades de Computación) a favor de WGP (Procesadores de Grupo de Trabajo) en sus GPU RDNA 3 de próxima generación. Dado que Navi 31 es una GPU MCM, tendrá dos direcciones IP principales, la GCD (Gráficos Core Template)) basado en el proceso de 5 nm de TSMC y MCD (plantilla de caché múltiple) basado en el nodo de proceso de 6 nm de TSMC. Los rumores anteriores indican que AMD ha Ya extraje su plantilla de GPU Navi 31.

La configuración de la GPU Navi 31 que se muestra aquí presenta dos GCD (plantilla de núcleo gráfico) y un MCD (plantilla de caché múltiple). Cada GCD contiene 3 Shader Engines (6 en total) y cada Shader Engine contiene 2 Shader Arrays (2 por SE / 6 por GCD / 12 en total). Cada Shader Array consta de 5 WGP (10 por SE / 30 por GCD / 60 en total) y cada WGP comprende 8 unidades SIMD32 con 32 ALU (40 SIMD32 por SA / 80 por SE / 240 por GCD / 480 en total). Estos módulos SIMD32 se combinan para formar 7,680 núcleos por GCD y 15,360 núcleos en total.

READ  YouTube Music actualiza su función de navegación de canciones para usuarios de iPhone

En cuanto al rendimiento, se espera que la GPU tenga una velocidad de reloj de 2,4 a 2,5 GHz, lo que sitúa su rendimiento teórico en alrededor de 75 TFLOP (FP32). Esa es una increíble mejora del 226% con respecto a la tarjeta gráfica Radeon RX 6900 XT.

El nuevo algoritmo Raptoreum Crypto Mining convierte las CPU AMD Ryzen con cachés L3 masivos en máquinas generadoras de dinero

El MCD Navi 31 (RDNA 3) se conectará a GCD duales a través de Infinity Fabric interconectado de próxima generación y contará con 256-512 MB de caché Infinity. Cada GPU también debe tener 4 puentes de memoria (32 bits). Este es un total de 8 controladores de memoria de 32 bits para una interfaz de bus de 256 bits. Se informa que la tarjeta incluirá hasta 32 GB de memoria GDDR6 operando a velocidades de 18 GB por segundo, lo que proporciona un ancho de banda de hasta 576 GB / s. Otro rumor que ha surgido recientemente es que AMD Utilizará 3D Infinity Cache En la alineación RDNA 3 que integrará la nueva caché en grupos verticales en GPU, similar al método Los chips Vermeer-X apilarán la caché L3 encima del CCD.

AMD RDNA GPU primaria (comparación de generaciones):

Nombre de la GPU Navi 10 Navi 21 Navi 31
Operación de GPU 7 nm 7 nm 5 nm (6 nm?)
Paquete de GPU congénere congénere MCD (plantilla de varios chips)
Motores de sombreado 2 4 6
GPU WGP 20 40 30 (por MCD)
60 (en total)
SP por WGP 128 128 256
Unidades de cálculo (por plantilla) 40 80 120 (por MCD)
240 (en total)
núcleos (por dado) 2560 5120 7680
colores (total) 2560 5120 15360 (2 x MCD)
Bus de memoria 256 bits 256 bits 256 bits
tipo de memoria GDDR6 GDDR6 GDDR6
caché infinito No disponible 128 MB 256-512 MB
SKU principal Radeon RX 5700 XT Radeon RX 6900 XTX Radeon RX 7900 XT
TBP 225 W 330W 420-450W
lanzamiento Tercer trimestre de 2019 Cuarto trimestre de 2020 Cuarto trimestre de 2022
READ  Apple finaliza el programa de reparación de la placa lógica del iPhone 8 que comenzó en 2018

Tarjeta gráfica NVIDIA GeForce RTX 4090 – GPU insignia AD102 con tecnología Ada Lovelace

Según rumores anteriores, hubo rumores de que NVIDIA estaría usando el nodo de proceso N5 (5nm) de TSMC para sus GPU Ada Lovelace. Esto también incluye el SKU AD102, que será un diseño completamente roscado. En su tweet reciente que habla sobre configuraciones específicas de GPU, se dice que la GPU AD102 presenta una velocidad de reloj de hasta 2.5GHz (el aumento promedio es 2.3GHz). Un tweet específico afirma que el reloj de la GPU de Ada Lovelace ‘AD102’ podría ser de 2,3 GHz o más, así que tomemos eso como referencia y especificaciones filtradas previamente para ver dónde debería aterrizar el rendimiento.

La NVIDIA AD102 «ADA GPU» parece tener 18,432 núcleos CUDA basados ​​en especificaciones en bruto (que pueden cambiar), alojados en 144 unidades SM. Eso es casi el doble de los núcleos en Ampere, que ya fue un movimiento masivo de Turing. La velocidad de reloj de 2,3-2,5 GHz nos proporciona hasta 85 a 92 TFLOP de rendimiento informático (FP32). Esto es más del doble del rendimiento del FP32 que el RTX 3090 actual, que incluye 36 TFLOP de potencia de cómputo FP32.

El salto de rendimiento del 150% parece enorme, pero hay que recordar que NVIDIA realmente dio un gran salto en los números de FP32 de esta generación con el Ampere. La GPU Ampere GA102 (RTX 3090) ofrece 36 TFLOP, mientras que la GPU Turing TU102 (RTX 2080 Ti) ofrece 13 TFLOP. Este es un aumento de más del 150% en FP32 Flops, pero el aumento del rendimiento de juegos en el mundo real para el RTX 3090 promedió un 50-60% más rápido que el RTX 2080 Ti. Entonces, lo único que no debemos olvidar es que Flops no iguala el rendimiento de los juegos de la GPU en estos días. Además, no sabemos si 2,3-2,5 GHz es el aumento promedio o el aumento máximo, ya que lo primero significa que puede haber un mayor potencial informático para el AD102.

READ  macOS 14.3.1, iOS 17.3.1 y iPadOS 17.3.1 Corrige el error de secuencia de comandos de WebKit

Aparte de eso, el filtrador también menciona que la insignia NVIDIA GeForce RTX 40 mantendrá su interfaz de bus de 384 bits, similar a la RTX 3090. Curiosamente, el filtrador menciona el G6X, lo que significa que NVIDIA no se moverá al nuevo estándar de memoria. hasta después de Ada Lovelace y aproveche las velocidades más rápidas. El pin más alto de 21 Gbps del G6X es para tarjetas de próxima generación antes de que veamos un estándar más nuevo (como GDDR7). La tarjeta contará con 24 GB de memoria, por lo que podemos esperar una DRAM de una cara de 16 GB o una DRAM de dos caras de 8 GB.

Introducción a la GPU NVIDIA CUDA (se rumorea):

GPU TU102 GA102 M 102
Ingeniería arquitectónica Turing Amperio Ada Lovelace
Procesando TSMC 12 nm NFF Samsung 8nm 5 nm
Kits de procesamiento de gráficos (GPC) 6 7 12
Kits de procesamiento de textiles (TPC) 36 42 72
flujo multiprocesador (SM) 72 84 144
colores Koda 4608 10752 18432
TFLOP teóricos 16,1 37,6 ~ 90 TFLOPs?
tipo de memoria GDDR6 GDDR6X GDDR6X
Bus de memoria 384 bits 384 bits 384 bits
Capacidad de memoria 11 GB (2080T) 24 GB (3090) 24 GB (4090?)
SKU principal RTX 2080 Ti RTX 3090 RTX 4090?
TGP 250 vatios 350W 450-650 vatios?
lanzamiento Septiembre de 2018 20 de septiembre 2022 (por confirmar)

Las GPU NVIDIA Ada Lovelace impulsarán las tarjetas gráficas GeForce RTX 40 de próxima generación que serán compatibles con las tarjetas gráficas AMD RDNA 3 Radeon RX 7000. Todavía hay algunas especulaciones sobre el uso de MCM por parte de NVIDIA. GPU Hopper, que se dirige principalmente al segmento de centros de datos e inteligencia artificial, Se afirma que el registro llegará pronto. Contará con arquitectura MCM. NVIDIA no utilizará el diseño MCM en sus GPU Ada Lovelace, por lo que mantendrá el diseño tradicional monolítico.

¿Qué GPU de próxima generación esperas más?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *