Whisper.cpp adalah library pengenal ucapan otomatis berkinerja tinggi yang menggunakan model OpenAI Whisper dan dapat diintegrasikan dengan FFmpeg.
Instalasi melibatkan meng-clone repository whisper.cpp, mengunduh model, membangun library dengan CMake, dan menginstalnya.
FFmpeg harus dikompilasi ulang dengan opsi --enable-whisper agar filter whisper tersedia.
Filter whisper di FFmpeg memungkinkan transkripsi audio menjadi teks, SRT, atau JSON hanya dengan satu perintah.
Dukungan GPU dapat diaktifkan untuk mempercepat proses transkripsi secara real-time.
Fitur Voice Activity Detection (VAD) membantu memecah audio menjadi potongan berdasarkan bicara dan keheningan.
Transkripsi dapat diterapkan pada file media, streaming langsung, atau input mikrofon.
Output transkripsi dapat disimpan ke file, dikirim ke standar output, atau dikirim ke layanan eksternal via HTTP.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"