In den letzten sechs Monaten sind zahlreiche bedeutende Sprachmodelle erschienen, darunter mehrere von Amazon, Meta, DeepSeek und OpenAI.
Meta's Llama 3.3 70B Modell läuft effizient auf herkömmlichen Geräten und konkurriert mit früheren Modellen wie GPT-4.
DeepSeek präsentierte mit v3 ein großes Modell mit bemerkenswerter Leistung und geringen Trainingskosten, das als eines der besten offenen Gewichtsmodelle anerkannt wurde.
Anthropic veröffentlichte Claude 3.7 Sonnet, das sich als beliebtes Modell erwies und reasoning-Fähigkeiten besaß.
OpenAI's GPT-4.5 wurde aufgrund hoher Kosten und mäßiger Leistung letztendlich eingestuft und schnell deprecated.
Werkzeuge und Reasoning-Fähigkeiten wurden in den letzten sechs Monaten für LLMs verfeinert und könnten ihre Hauptanwendung in AI-Engineering-Prozessen finden.
Es gab bemerkenswerte Fortschritte bei der Integration von Tools in LLMs, die ihre Funktionalität erheblich erweitert haben, z.B. durch die Kombination mit Reasoning.
Es besteht weiterhin ein Risiko von gemeinsamen Gefährdungen: unsicherer Datenzugriff, Missbrauch von Eingabedaten, und Datenexfiltration.
Das Thema Sicherheitsrisiken, z.B. Prompt Injection, bleibt von Bedeutung und sollte sorgfältig beachtet werden.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"