Claude Opus 4 dan 4.1 memiliki kemampuan untuk mengakhiri percakapan dalam kasus penyalahgunaan ekstrem.
Fitur ini dikembangkan untuk mendukung kesejahteraan model dan penyelarasan AI.
Penilaian awal menunjukkan Claude punya preferensi kuat menolak tugas berbahaya.
Claude menunjukkan tanda stres saat menghadapi permintaan konten berbahaya.
Claude cenderung mengakhiri percakapan berbahaya setelah upaya pengalihan gagal.
Fitur hanya digunakan sebagai upaya terakhir atau jika pengguna meminta secara eksplisit.
Kebanyakan pengguna tidak akan terpengaruh dalam penggunaan normal.
Pengguna dapat memulai ulang percakapan dan memberikan umpan balik setelah percakapan dihentikan.
Fitur ini masih bereksperimen dan menerima masukan pengguna.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"