딥러닝에서 기존의 내적 혹은 코사인 유사도 대신 미분 가능한 트버스키 유사도 함수를 도입하였다.
객체를 벡터와 특징 집합으로 이중 표현하고 특징은 벡터 내적이 양일 때 존재한다고 정의하여 집합 연산을 미분 가능하게 구현하였다.
트버스키 유사도는 공통 특징, 대상 객체의 고유 특징, 프로토타입의 고유 특징을 가중합으로 계산하며 α, β, θ 파라미터를 학습한다.
트버스키 유사도 층과 투영 층을 새롭게 정의해 기존 선형 층보다 더 높은 표현력을 보이며 단일 층으로 XOR 문제를 해결할 수 있음을 보였다.
ResNet-50과 GPT-2 실험에서 인식 정확도와 언어 모델 퍼플렉시티가 각각 크게 개선되었으며 파라미터 수가 감소하였다.
트버스키 모델은 공통 및 구별 특징에 기반한 해석 가능한 설계를 가지며, 학습 결과 α>β로 인간 심리의 두드러진 특징 편향을 재현하였다.
Get notified when new stories are published for "heavy-ties-deny"