OpenAI cobra por transcripciones según la duración del audio o la cantidad de tokens; acelerar el audio reduce ambos.
Con ffmpeg se puede duplicar o triplicar la velocidad (2x o 3x) con mínima pérdida de calidad.
Reducir la duración del audio en 2x o 3x ahorra hasta un 33% en costos de transcripción.
El flujo de trabajo incluye usar yt-dlp para extraer el audio, ffmpeg para acelerar y la API de OpenAI para transcribir.
A 4x de velocidad la transcripción pierde precisión; 2x y 3x son el punto óptimo.
Este método también ahorra tiempo de espera al procesar archivos más cortos.
Get notified when new stories are published for "🇪🇸 Hacker News Espanyol"