GB202 er Blackwells største die på 750 mm2 med 92,2 milliarder transistorer og 192 SMs.
Nvidia bruger en SM til GPC-forhold på 16:1 for effektiv opskalering af kerner.
Blackwell fjerner subchannel-switches og overlapper grafik- og beregningsopgaver på samme kø.
SM-frontend har 32 KB L0- og 128 KB L1-instruktionscache til høj instruktionsbåndbredde.
Hver SM-partition har en 32-bred pipeline til både FP32 og INT32-operationer.
Blackwell har 16 INT32-multiplikatorer per partition og fordobler raytracing-intersectionshastigheden.
Hver SM har 128 KB delt L1/Shared Memory, hvilket giver 24 MB samlet på RTX PRO 6000.
Blackwell opnår over 60 TB/s i SM-hukommelsesbåndbredde og 8,7 TB/s i L2-båndbredde.
Blackwells L2-latens er cirka 130 ns, mens VRAM-latens er omkring 329 ns, højere end AMDs ~254 ns.
Nvidia dominerer FluidX3D-beregning med højere hukommelses- og compute-båndbredde.
Blackwell er et monolitisk 750 mm2 design med op til 600 W TDP som største forbrugergpu.
Nvidia fastholder topspositionen uden reel konkurrence fra AMD eller Intel i high-end segmentet.
Get notified when new stories are published for "🇩🇰 Hacker News Dansk"