Everynewsopen beta

Marketplace

Everynews

Stats

39 happy users32 timely alerts12,147 surprising stories

Story

The Story Behind Firefighter Mode

Socials

© 2025 Everynews. All rights reserved.

Privacy Policy Terms of Service Support

•

1

2

3

🇯🇵 Hacker News 日本語•June 21, 2025 at 10:17 AM

AbsenceBench：欠落検出の限界

1

大規模言語モデル（LLM）は明示的に省略された情報の検出に苦戦する

2

AbsenceBenchを導入し、数値列・詩・GitHubプルリクエストの３領域で欠落箇所検出を評価

3

最先端モデルClaude-3.7-SonnetでさえF1スコア69.6％と低性能

4

Transformerの注意機構は「情報の欠落」を直接参照できない構造的制約が原因

5

既存のタスク（NIAH）での超人的性能と、欠落検出タスクでの性能崩壊を対比する事例

Subscribe to Similar Stories

Get notified when new stories are published for "🇯🇵 Hacker News 日本語"

No Sign-In needed. One-Click Subscribe.