Differentierbar Tversky-lighed i Dyb Læring

1

Forskerne introducerer en differentiérbar parameterisering af Tversky-lighed som alternativ til dotprodukt og cosinus-lighed.

2

De definerer to nye lag: Tversky Similarity Layer og Tversky Projection Layer til dybe netværk.

3

Objekter repræsenteres både som kontinuerlige vektorer og som mængder af ’feature’-egenskaber med differentiérbare mængdeoperationer.

4

En enkelt Tversky-projektionslag kan modellere XOR-funktion, hvilket demonstrerer øget udtrykskapacitet.

5

Eksperimenter viser forbedret nøjagtighed i billedgenkendelse (ResNet-50) og lavere perplexity i sprogmodellering (TverskyGPT-2).

6

Tversky-lagene giver indbygget fortolkning ved at basere beslutninger på fælles og karakteristiske træk.

7

Modellerne lærer parametre med større vægt på input-distinkte træk (α>β), i overensstemmelse med psykologiske observationer.