Nvidia lançou o GB202, seu maior chip Blackwell de 750 mm² com 92,2 bilhões de transistores e 192 SMs.
A razão SM:GPC em Blackwell é de 16:1, permitindo escalar o número de núcleos sem aumentar o hardware de distribuição de tarefas.
Blackwell elimina subchannel switches, suportando sobreposição de workloads gráficas e de computação no mesmo queue.
Cada SM inclui 32 KB de cache L0i por partição e cerca de 128 KB de cache L1i compartilhada, capaz de armazenar até 8 mil instruções.
A pipeline unificada de 32 vias para FP32 e INT32 sustenta alta taxa de multiplies INT32 e evita stalls por tipo de dado.
O SM possui 128 KB de L1/Shared Memory com largura de até 128 B/ciclo, totalizando mais de 60 TB/s no GPU completo e 24 MB no total.
A latência do L2 aumentou para ~130 ns em Blackwell, mas o cache de 64 blocos equilibra capacidade e desempenho.
O GPU atinge cerca de 8,7 TB/s de largura de banda no L2 e mantém alta largura de banda na GDDR7 de 512 bits.
Em testes FluidX3D, o RTX PRO 6000 Blackwell superou amplamente o RX 9070 da AMD em computação e memória.
A estratégia da Nvidia foca em escalar ao máximo o número de SMs e combinar cache flexível com grande largura de banda de VRAM.
Get notified when new stories are published for "🇵🇹 Hacker News Português"