Google definisce la quinta epoca del calcolo distribuito, caratterizzata da requisiti di rete per l’era GenAI con richieste di 10X di computing ogni anno.
Le reti del futuro devono supportare burst sincroni a velocità di linea a granularità millisecondo, bassa latenza e prevedibilità estrema.
Firefly è un sistema di sincronizzazione dei clock a scala di datacenter che permette scheduling accurato dei flussi di rete con precisione sub-10 nanosecondi.
Swift è un metodo di controllo della congestione basato sul ritardo che mantiene code di bassa lunghezza consentendo throughput elevato e perdita di pacchetti quasi nulla.
Falcon è un protocollo hardware di trasporto affidabile e a bassa latenza implementato sui DPU Mount Evans in collaborazione con Intel per ottimizzare RDMA in datacenter.
Il rilevamento dei stragglers identifica rapidamente guasti hard e soft nei nodi di AI eliminando automaticamente i colli di bottiglia.
La prevedibilità e sincronizzazione delle reti consente di ridurre i tempi di inattività delle GPU e incrementare l’efficienza dei cluster AI.
Get notified when new stories are published for "Hacker News 🇮🇹 Italiano"