OpenAI meluncurkan DeepResearch, varian khusus O3 untuk pencarian web dan dokumen yang mampu merencanakan strategi pencarian, merujuk silang sumber, dan memanfaatkan umpan balik untuk kueri.
Model RL berbasis draf seperti DeepResearch dan Claude Sonnet 3.7 menunjukkan kemampuan melakukan tugas multi-langkah panjang lebih baik daripada sistem workflow berbasis aturan.
Definisi LLM agent oleh Anthropic adalah sistem dimana LLM secara dinamis mengendalikan proses dan penggunaan alat untuk menyelesaikan tugas.
Pendekatan hybrid generatif AI dan rule-based seperti Manus AI terjebak dalam bitter lesson karena tidak dapat merencanakan, mengingat, dan bertindak efektif dalam jangka panjang.
Resep unggul LLM agents mengombinasikan reinforcement learning dan reasoning dengan verifikasi hasil menggunakan classifier atau model LLM-penilai.
Pelatihan LLM agents memerlukan emulasi skala besar untuk mensimulasikan lingkungan pencarian atau interaksi guna mengatasi kurangnya data agentic publik.
LLM agents memungkinkan proses pencarian otomatis yang dinamis: analisis kueri, pemilihan sumber, perencanaan langkah, dan pelacakan jejak penalaran.
Pengembangan LLM agents terkonsentrasi pada laboratorium besar yang memiliki data, know-how, dan infrastruktur, sehingga penting untuk mendemokratisasi akses pelatihan dan deployment.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"