Peneliti mengganti fungsi kemiripan dot product/cosine dengan fungsi kemiripan Tversky yang lebih sesuai dengan penilaian kemiripan manusia berdasarkan psikologi kognitif.
Fungsi kemiripan Tversky dibuat diferensial dengan merepresentasikan objek sebagai vektor dan himpunan fitur sehingga dapat dioptimasi menggunakan algoritma gradient.
Diperkenalkan dua lapisan baru: Tversky Similarity Layer untuk menghitung kemiripan antara dua vektor dan Tversky Projection Layer untuk memproyeksikan input ke prototipe menggunakan fungsi kemiripan Tversky.
Lapisan Tversky Projection mampu memodelkan fungsi XOR nonlinear dalam satu lapisan, menunjukkan kapasitas ekspresif yang lebih tinggi dibanding lapisan linier tunggal.
Penggantian lapisan linier dengan lapisan Tversky meningkatkan akurasi klasifikasi citra (ResNet-50) dan menurunkan perplexity pada pelatihan GPT-2 kecil.
Model ini secara bawaan lebih interpretabel karena menggunakan konsep fitur umum dan khas, memungkinkan penjelasan keputusan model berdasarkan fitur psikologis.
Visualisasi fitur dan prototipe pada tugas MNIST memperlihatkan pola goresan yang mudah dikenali manusia, berbeda dengan pola tak terinterpretasi pada lapisan linier.
Model yang dilatih konsisten belajar parameter dimana α > β, mengonfirmasi hipotesis salience Tversky secara psikologis.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"