FFmpeg ile Whisper Ses Transkripsiyonu

Whisper.cpp kütüphanesiyle OpenAI Whisper modeli kullanılarak yüksek performanslı konuşma tanıma sağlanıyor.

FFmpeg’e entegre edilen whisper filtresi ile tek bir komutla ses dosyaları veya canlı yayınlar gerçek zamanlı olarak yazıya dökülebiliyor.

GPU desteğiyle performans artırılabiliyor ve FFmpeg’in AVIO protokolleri üzerinden transkript sonuçları dosyalara veya servislere yönlendirilebiliyor.

SRT veya JSON formatında çıktı alınarak video altyazısı oluşturmak veya harici servislere veri göndermek mümkün oluyor.

VAD (Ses Aktivite Tespiti) özelliği sayesinde mikrofon veya WebRTC akışları gibi canlı ses kaynaklarından doğru kırılımlar elde edilebiliyor.

Subscribe to Similar Stories

Get notified when new stories are published for "Hacker News 🇹🇷 Türkçe"

No Sign-In needed. One-Click Subscribe.

•

Hacker News 🇹🇷 Türkçe•August 11, 2025 at 10:24 PM