Tiny TPU: hvorfor og hvordan

1

Et hold af begyndere genopfandt en TPU fra bunden for at lære hardwaredesign og dyb læring ved at eksperimentere og 'hacke' løsninger uden eksterne kilder.

2

En TPU er en specialiseret ASIC, der er optimeret til matrixmultiplikationer, som udgør størstedelen af beregningerne i neurale netværk.

3

Kernen i designet er en systolisk array bestående af Processing Elements (PE), der udfører multiply-accumulate-operationer hvert clock cycle.

4

Input- og vægtmatricer roteres, forsinkes (staggering) og transponeres for at strømline dataflowet gennem systolisk array.

5

Pipelining, dobbelt buffering samt kontrolsignaler (start, switch og accept) muliggør kontinuerlig inferens uden idle moduler.

6

Under systolisk array findes moduler til bias-tilføjelse og Leaky ReLU-aktivering, samlet i en vektorbehandlingsenhed (VPU) til elementvise operationer.

7

Til træning genbruges samme arkitektur til backpropagation ved hjælp af kædereglen, gradientberegninger i hardware og en Unified Buffer-scratchpad til at gemme mellemresultater.

8

En 94-bit instruktionssætarkitektur styrer alle moduler og sikrer effektiv udnyttelse af TPU’en til både inferens og træning.

Tiny TPU: hvorfor og hvordan

Subscribe to Similar Stories

Tiny TPU: hvorfor og hvordan

Subscribe to Similar Stories