OpenAI rekent kosten voor transcripties op basis van audiotijd of tokens.
Met ffmpeg kun je audio op 2x of 3x versnellen voordat je het naar de API stuurt.
Versnellen van audio verkleint de duur en reduceert het aantal audio-inputtokens, wat geld bespaart.
Tests laten zien dat 2x versnellen ongeveer 23% en 3x versnellen ongeveer 33% kostenbesparing oplevert.
De transcriptiekwaliteit blijft vrijwel gelijk bij 2x en 3x snelheden, terwijl 4x al te snel en onnauwkeurig is.
Een eenvoudige workflow combineert yt-dlp, ffmpeg, OpenAI’s transcribeer-API en llm voor samenvattingen.
Get notified when new stories are published for "🇳🇱 Hacker News Dutch"