Το GB202 είναι το μεγαλύτερο Blackwell die με επιφάνεια 750 mm2, 92,2 δισ. τρανζίστορ και 192 SMs.
Η αναλογία SM προς GPC 1:16 επιτρέπει υψηλή κλίμακα πυρήνων, αλλά μπορεί να περιορίζει την απόδοση σε μικρούς, βραχύβιους dispatches.
Η Blackwell υποστηρίζει αληθινή επικαλυπτόμενη εκτέλεση γραφικών και υπολογιστικών εργασιών στην ίδια ουρά χωρίς subchannel switch.
Το frontend των SMs χρησιμοποιεί σταθερού μήκους 128-bit εντολές με 32 KB L0 και 128 KB L1i cache για αυξημένο bandwidth εντολών.
Κάθε SM partition έχει 32-πλάσια εσωτερική δομή εκτέλεσης FP32/INT32, 16 πολλαπλασιασμούς INT32 ανά κύκλο και μπορεί να διαχειριστεί 12 waves.
Το uniform datapath πλέον υποστηρίζει FP εντολές, αλλά παραμένει λιγότερο ευέλικτο από το scalar unit της AMD RDNA4.
Το SM memory subsystem περιλαμβάνει 128 KB κοινό L1/Shared Memory με εύρος έως 128 B/κύκλο και συνολικά >60 TB/s.
Το L2 cache χωρίζεται σε 64 τράπεζες με bandwidth ~8,7 TB/s, αλλά έχει αυξημένη latencies (~130 ns) λόγω μεγάλης κλίμακας.
Η GDDR7 μνήμη με 512-bit δίαυλο προσφέρει κορυφαία εύρος ζώνης VRAM, ενισχύοντας σημαντικά την απόδοση.
Η Blackwell επικρατεί στις κορυφαίες καταναλωτικές GPU με μονολιθικό σχεδιασμό, υψηλό αριθμό SMs και ισχυρή υπολογιστική και μνημονική απόδοση.
Get notified when new stories are published for "🇬🇷 Hacker News Ελληνικά"