Mithilfe von ffmpeg kann man Audio auf 2x oder 3x beschleunigen, um die Dateidauer deutlich zu verkürzen.
Kürzere Audiodauer verringert die Anzahl der Audio-Input-Token bei OpenAI und senkt so die Transkriptionskosten.
Bei 2x und 3x Geschwindigkeit bleibt die Transkriptionsqualität nahezu unverändert, da Modelle und Gehirn kleine Verluste ausgleichen.
Anwendungsbeispiel: Ein 40-minütiges Audio lässt sich mit 3x Geschwindigkeit um etwa 23 % günstiger transkribieren.
4x Beschleunigung führt zu starkem Qualitätsverlust und unbrauchbaren Transkriptionen.
Empfohlener Workflow: yt-dlp zum Extrahieren, ffmpeg für atempo-Filter, und anschließende Transkription via OpenAI API.
Die Output-Token-Anzahl bleibt bei beschleunigten Audios mit gleicher Informationsmenge nahezu konstant.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"