Architektura Blackwell Nvidii w die GB202 ma 750 mm2 i 92,2 mld tranzystorów, z 192 jednostkami SM na największym GPU.
Stosunek SM do GPC w Blackwell wynosi 16:1, co pozwala zwiększyć przepustowość obliczeń bez proporcjonalnego wzrostu sprzętu dystrybuującego pracę.
Blackwell usuwa przełączanie podkanałów, umożliwiając jednoczesne wykonywanie zadań graficznych i obliczeniowych na tej samej kolejce.
Instrukcje SM korzystają z dwu poziomowego cache: 32 KB L0 na partycję i około 128 KB L1 na całe SM, co wspiera 8 tys. instrukcji.
Każda partycja SM ma 32-szerokie potoki FP32/INT32 z możliwością 16 mnożeń INT32 na cykl i 12 aktywnych fal w ukryciu opóźnień.
Blackwell dysponuje 128 KB wspólnej pamięci L1/Shared Memory na SM o przepustowości 128 B/cykl, a na karcie RTX PRO 6000 daje to ponad 60 TB/s.
L2 Blackwell ma około 64 bloków i przepustowość ~8,7 TB/s, ale wyższe opóźnienie (~130 ns) niż poprzednie generacje.
RTX PRO 6000 Blackwell znacząco przewyższa AMD RX 9070 we wszystkich testach obliczeniowych i pamięciowych, dzięki 188 SM i 24 MB pamięci L1/Shared Memory.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"