L'audio accelerato a 2x o 3x tramite ffmpeg riduce drasticamente la durata e i token di input per l'API di OpenAI
Con il modello gpt-4o-transcribe, la velocità 2x dimezza la durata a circa 20 minuti e la velocità 3x la riduce a circa 13 minuti
La trascrizione a 3x consente un risparmio fino al 33% sui costi di input token, abbattendo il costo totale a circa $0.07 per l'equivalente di 40 minuti originali
Velocità superiori a 3x (es. 4x) compromettono significativamente l'accuratezza della trascrizione
Il workflow utilizza yt-dlp, ffmpeg e chiamate curl per estrarre, accelerare e inviare l'audio all'API di OpenAI
Il limite di input audio di 25 minuti del modello gpt-4o-transcribe è aggirabile velocizzando il file
Get notified when new stories are published for "🇮🇹 Hacker News Italiano"