Openai Whisper
Transcrivez des fichiers audio localement avec Whisper d'OpenAI — aucune clé API requise, plusieurs langues et formats de sortie pris en charge.
npx clawhub@latest install openai-whisperLa compétence OpenAI Whisper permet à votre assistant IA de transcrire des fichiers audio en texte entièrement sur votre machine locale. Elle utilise le modèle Whisper open source d'OpenAI pour convertir la parole de fichiers audio (MP3, M4A, WAV, etc.) en texte, sous-titres ou autres formats de sortie. Elle prend également en charge la traduction d'audio non-anglais en texte anglais. Aucune clé API ni connexion Internet n'est nécessaire après le téléchargement initial du modèle.
Comment ça fonctionne
La compétence utilise le CLI whisper, qui exécute le réseau de neurones Whisper localement sur votre machine. Lors de la première utilisation, le modèle sélectionné est téléchargé dans ~/.cache/whisper. Vous fournissez un chemin de fichier audio, choisissez une taille de modèle (équilibre entre vitesse et précision) et spécifiez un format de sortie. Le CLI traite l'audio et génère la transcription dans le répertoire spécifié.
Fonctionnalités clés
--task translatePrérequis
Cas d'utilisation
Comment installer
npx clawhub@latest install openai-whispernpx clawhub@latest install openai-whisperAvis
0 avisSe connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !