SEALは大規模言語モデルの自己適応を可能にするフレームワークである。
モデル自身が生成するファインチューニングデータと更新指令により、持続的なウエイト更新を行う。
強化学習ループを用いて、効果的な自己編集を生産するようにモデルを訓練する。
知識の取り込みや少数ショットの一般化において有望な結果を示している。
Get notified when new stories are published for "🇯🇵 Hacker News 日本語"
No Sign-In needed. One-Click Subscribe.