Ostatnie sześć miesięcy w LLMs według Simona Willisona

1

Prezentacja przedstawia przyspieszający rozwój modeli językowych (LLMs) w ciągu ostatnich sześciu miesięcy.

2

Omówiono ponad 30 znaczących modeli wypuszczonych w tym okresie, które znacząco wpłynęły na branżę AI.

3

Problematyka wyboru najlepszych modeli w kontekście istniejących benchmarków i problemów z zaufaniem do rankingów.

4

Zabawa autora w testowanie modeli za pomocą generowania kodu SVG dla obrazów pelikanów na rowerach jako nieformalny benchmark.

5

Analiza kosztów i efektywności różnych modeli AI, ze szczególnym uwzględnieniem DeepSeek, GPT-4.5, oraz Gemini.

6

Przegląd problemów związanych z wykorzystaniem zaawansowanych narzędzi AI, w tym ryzykiem związanym z dostępem do internetu i eksfiltracją danych.

7

Discussed recent AI bugs and issues, including notable incidents with ChatGPT and Grok.

8

Podkreślono znaczenie narzędzi i rozumowania w AI oraz ich rosnące znaczenie w technologii MCP.

9

Zagrożenia związane z dostępem agentów AI do internetu i potencjalne ryzyko związane z wyciekiem danych poprzez złośliwe instrukcje.