Whisper.cpp kütüphanesiyle OpenAI Whisper modeli kullanılarak yüksek performanslı konuşma tanıma sağlanıyor.
FFmpeg’e entegre edilen whisper filtresi ile tek bir komutla ses dosyaları veya canlı yayınlar gerçek zamanlı olarak yazıya dökülebiliyor.
GPU desteğiyle performans artırılabiliyor ve FFmpeg’in AVIO protokolleri üzerinden transkript sonuçları dosyalara veya servislere yönlendirilebiliyor.
SRT veya JSON formatında çıktı alınarak video altyazısı oluşturmak veya harici servislere veri göndermek mümkün oluyor.
VAD (Ses Aktivite Tespiti) özelliği sayesinde mikrofon veya WebRTC akışları gibi canlı ses kaynaklarından doğru kırılımlar elde edilebiliyor.
Get notified when new stories are published for "Hacker News 🇹🇷 Türkçe"