通过ffmpeg将音频加速到2x或3x可显著减少转录时间和费用,且质量几乎无损
OpenAI按音频时长(whisper-1)或音频tokens(gpt-4o-transcribe)收费,加速后音频秒数减少,token数量下降从而省钱
2x和3x速度是效率与保真度的最佳平衡点,3x可在输入token成本上降低约33%,输出token数保持不变
4x速度会导致转录质量严重下降,不建议使用
可使用yt-dlp提取音频,ffmpeg加速转码,再通过OpenAI API转录并结合llm脚本自动化整个流程
Get notified when new stories are published for "🇨🇳 Hacker News 简体中文"