Transkripsi Audio Otomatis dengan FFmpeg dan Whisper

1

Whisper.cpp adalah library pengenal ucapan otomatis berkinerja tinggi yang menggunakan model OpenAI Whisper dan dapat diintegrasikan dengan FFmpeg.

2

Instalasi melibatkan meng-clone repository whisper.cpp, mengunduh model, membangun library dengan CMake, dan menginstalnya.

3

FFmpeg harus dikompilasi ulang dengan opsi --enable-whisper agar filter whisper tersedia.

4

Filter whisper di FFmpeg memungkinkan transkripsi audio menjadi teks, SRT, atau JSON hanya dengan satu perintah.

5

Dukungan GPU dapat diaktifkan untuk mempercepat proses transkripsi secara real-time.

6

Fitur Voice Activity Detection (VAD) membantu memecah audio menjadi potongan berdasarkan bicara dan keheningan.

7

Transkripsi dapat diterapkan pada file media, streaming langsung, atau input mikrofon.

8

Output transkripsi dapat disimpan ke file, dikirim ke standar output, atau dikirim ke layanan eksternal via HTTP.