Prezentacja przedstawia przyspieszający rozwój modeli językowych (LLMs) w ciągu ostatnich sześciu miesięcy.
Omówiono ponad 30 znaczących modeli wypuszczonych w tym okresie, które znacząco wpłynęły na branżę AI.
Problematyka wyboru najlepszych modeli w kontekście istniejących benchmarków i problemów z zaufaniem do rankingów.
Zabawa autora w testowanie modeli za pomocą generowania kodu SVG dla obrazów pelikanów na rowerach jako nieformalny benchmark.
Analiza kosztów i efektywności różnych modeli AI, ze szczególnym uwzględnieniem DeepSeek, GPT-4.5, oraz Gemini.
Przegląd problemów związanych z wykorzystaniem zaawansowanych narzędzi AI, w tym ryzykiem związanym z dostępem do internetu i eksfiltracją danych.
Discussed recent AI bugs and issues, including notable incidents with ChatGPT and Grok.
Podkreślono znaczenie narzędzi i rozumowania w AI oraz ich rosnące znaczenie w technologii MCP.
Zagrożenia związane z dostępem agentów AI do internetu i potencjalne ryzyko związane z wyciekiem danych poprzez złośliwe instrukcje.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"