Blackwell est une architecture GPU monolithique de 750 mm² avec 92,2 milliards de transistors et 192 SMs.
Elle améliore l’ordonnancement matériel pour mélanger efficacement workloads graphiques et compute.
Le front-end des SM utilise des instructions fixes de 16 octets avec caches L0 et L1 dédiés, offrant une meilleure bande passante instruction.
Les unités d'exécution rassemblent FP32 et INT32 dans un pipe 32 large, supportant 16 multiplications INT32 par cycle.
Le sous-système mémoire des SM propose 128 Ko partagés entre cache L1 et mémoire partagée, totalisant 24 Mo pour le GPU entier.
Le cache L2 de 64 blocs atteint 8,7 To/s mais souffre d’une latence accrue (~130 ns).
Le GPU double le débit des intersections rayon-triangle et offre une large bande passante VRAM GDDR7 sur bus 512-bit.
Face à RDNA4, Blackwell domine la performance brute grâce à son échelle massive, malgré des cœurs individuels moins puissants.
Get notified when new stories are published for "🇫🇷 Hacker News Français"