Forskerne introducerer en differentiérbar parameterisering af Tversky-lighed som alternativ til dotprodukt og cosinus-lighed.
De definerer to nye lag: Tversky Similarity Layer og Tversky Projection Layer til dybe netværk.
Objekter repræsenteres både som kontinuerlige vektorer og som mængder af ’feature’-egenskaber med differentiérbare mængdeoperationer.
En enkelt Tversky-projektionslag kan modellere XOR-funktion, hvilket demonstrerer øget udtrykskapacitet.
Eksperimenter viser forbedret nøjagtighed i billedgenkendelse (ResNet-50) og lavere perplexity i sprogmodellering (TverskyGPT-2).
Tversky-lagene giver indbygget fortolkning ved at basere beslutninger på fælles og karakteristiske træk.
Modellerne lærer parametre med større vægt på input-distinkte træk (α>β), i overensstemmelse med psykologiske observationer.
Get notified when new stories are published for "Hacker News 🇩🇰 Dansk"