Les GPU AMD RDNA 3 “Navi 3X” disposent du double du cache par unité de calcul et de la matrice de shaders

AMD a répertorié les dernières informations concernant les tailles de cache de leurs prochains GPU RDNA 3 “Navi 3X” dans les correctifs Linux.
Les GPU RDNA 3 de nouvelle génération d’AMD pour la gamme Navi 3X doublent la taille du cache pour les unités de calcul et la matrice de shaders
Publié sur le référentiel FreeDesktop Linux par Aaron Liu d’AMD et découvert par Coelacanth-Dream et Kepler_L2nous voyons les premiers détails concernant les tailles de cache dans les prochains GPU RDNA 3 tels que les puces Navi 31, Navi 32 et Navi 33 qui ont récemment fait l’objet d’une fuite.
En ce qui concerne les détails, la gamme de GPU AMD RDNA 3 (GFX11) comportera le double du cache vectoriel L0 pour chaque unité de calcul ou CU et également le double du cache de données GL1 (cache RDNA L1 pour chaque Shader Array ou SA. Selon les nouvelles informations , le fichier de registre vectoriel par SIMD passera à 192 Ko contre 128 Ko sur RDNA 2, le cache de vecteur/texture L0 passera de 16 Ko à 32 Ko par CU, le cache de données GPU L1 par Shader Array passera de 128 Ko à 256 Ko tandis que le cache de données L2 restera le même que RDNA 2.
Il existe également des tailles de cache répertoriées pour les APU Navi 33 et Phoenix d’AMD qui comprendront également un cœur graphique RDNA 3 mais dans un package monolithique. La taille du vecteur/texture L0 est augmentée de 16 Ko à 32 Ko, tandis que le cache de données L1 (graphiques) passe de 128 Ko à 256 Ko. La taille du fichier de registre reste inchangée sur les GPU Navi 33 et les APU Phoenix.
Informations sur le cache | Carpe Jaune (Rembrandt) | RDNA 3 (GFX11 Navi 31/32) | Phénix (GC 11.0.1, GFX1103) |
---|---|---|---|
Fichier de registre vectoriel L0 par SIMD | 128Kio | 192Kio | 128Kio |
Données vectorielles L0 (par CU) | 16Kio | 32Kio | 32Kio |
L1 Scalaire Inst. (par WGP) | 32Kio | 32Kio | 32Kio |
Données scalaires L1 (par WGP) | 16Kio | 16Kio | 16Kio |
Date GL1 (par SA) | 128Kio | 256Kio | 256Kio |
Données L2 | 2048Kio (2MiB) | 2048Kio (2MiB) | 2048Kio (2MiB) |
L3 (CENTRE COMMERCIAL) | N / A | Oui | N / A |
Coelacanth-Dream indique également que tous les GPU RDNA 3 “Navi 3X” sont livrés avec des instructions VODP (Dual-Issue Wave32), un support WMMA (Wave Matrix Multiply-Accumulate) et que les performances par WGP ont été considérablement améliorées. L’augmentation du cache GL1 est censée améliorer les performances de traitement des pixels et fait partie des nombreux changements qu’AMD apporte à sa famille de GPU RDNA 3 Navi 3x.
AMD a confirmé que ses GPU RDNA 3 arriveront plus tard cette année avec une énorme amélioration des performances. Le vice-président principal de l’ingénierie de la société, Radeon Technologies Group, David Wang, a déclaré que les GPU de nouvelle génération pour la série Radeon RX 7000 offriront plus de 50 % de performances par watt par rapport aux GPU RDNA 2 existants. Certaines des fonctionnalités clés des GPU RDNA 3 mises en avant par AMD comprendront :
- Nœud de processus 5nm
- Emballage de puces avancé
- Unité de calcul repensée
- Pipeline graphique optimisé
- Cache AMD Infinity de nouvelle génération
- >50 % de performances/watts par rapport à RDNA 2
AMD réorganisera les unités de calcul au sein de RDNA 3 pour offrir des capacités de lancer de rayons améliorées. Bien qu’il n’y ait aucune mention de ce que sont ces capacités si nous devions deviner, nous dirions qu’il s’agit certainement de performances et d’un ensemble de fonctionnalités avancées sur le cœur du GPU RDNA 3 pour les cartes graphiques Radeon RX 7000. Les cartes graphiques AMD Radeon RX 7000 vont être lancées plus tard cette année et offriront un grand bond en avant dans les performances de jeu, alors restez à l’écoute pour plus d’informations dans les semaines à venir.
Configurations du processeur graphique AMD RDNA 3 Navi 3X (préliminaire)
Nom du processeur graphique | Navi 21 | Navi 33 | Navi 32 | Navi 31 | Navi 3X |
---|---|---|---|---|---|
Nom de code | Cichlidé de Sienne | Bonefish rose vif | Nas de blé | Bonite aux prunes | À déterminer |
Processus GPU | 7nm | 6nm | 5nm/6nm | 5nm/6nm | 5nm/6nm |
Forfait GPU | Monolithique | Monolithique | MCM (1 GCD + 4 MCD) | MCM (1 GCD + 6 MCD) | MCM (à déterminer) |
Taille de matrice GPU | 520mm2 | 203mm2 (uniquement GCD) | 200mm2 (uniquement GCD) 425 mm2 (avec MCD) |
308mm2 (uniquement GCD) 533 mm2 (avec MCD) |
À déterminer |
Moteurs de shader | 4 | 2 | 4 | 6 | 8 |
WGP GPU | 40 | 16 | 30 | 48 | 64 |
SP par WGP | 128 | 256 | 256 | 256 | 256 |
Unités de calcul (par matrice) | 80 | 32 | 60 | 96 | 128 (par GPU) 256 (Total) |
Noyaux (par matrice) | 5120 | 4096 | 7680 | 12288 | 8192 |
Cœurs (Total) | 5120 | 4096 | 7680 | 12288 | 16 384 |
Bus mémoire | 256 bits | 128 bits | 256 bits | 384 bits | 384 bits x2 ? |
Type de mémoire | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
Capacité mémoire | Jusqu’à 16 Go | Jusqu’à 8 Go | Jusqu’à 16 Go | Jusqu’à 24 Go | Jusqu’à 32 Go |
Vitesse de la mémoire | 16-18 Gbit/s | À déterminer | À déterminer | 20 Gbit/s | À déterminer |
Bande passante mémoire | 512-576 Go/s | À déterminer | À déterminer | 960 Go/s | À déterminer |
Cache infini | 128 Mo | 32 Mo | 64 Mo | 96/192 Mo | À déterminer |
UGS phare | Radeon RX 6900 XTX | Radeon RX 7600 XT ? | Radeon RX 7800 XT ? Radeon RX 7700 XT ? |
Radeon RX 7900 XT ? | Radeon Pro |
PAD | 330W | ~150W | ~250W | ~350W | À déterminer |
Lancement | T4 2020 | Q4 2022 ? | Q4 2022 ? | Q4 2022 ? | 2023 ? |