Openai Whisper
Transkribiere Audiodateien lokal mit OpenAIs Whisper – kein API-Schlüssel nötig, mehrere Sprachen und Ausgabeformate unterstützt.
npx clawhub@latest install openai-whisperDie OpenAI Whisper Skill ermöglicht es Ihrem KI-Assistenten, Audiodateien vollständig auf Ihrem lokalen Computer in Text zu transkribieren. Es verwendet OpenAIs Open-Source Whisper-Modell, um Sprache aus Audiodateien (MP3, M4A, WAV usw.) in Text, Untertitel oder andere Ausgabeformate zu konvertieren. Es unterstützt auch die Übersetzung von nicht-englischen Audiodateien in englischen Text. Nach dem initialen Modell-Download werden kein API-Schlüssel oder Internetverbindung benötigt.
Funktionsweise
Die Skill verwendet das whisper CLI, das das Whisper-Neuronales Netzwerk lokal auf Ihrem Computer ausführt. Bei der ersten Verwendung wird das ausgewählte Modell nach ~/.cache/whisper heruntergeladen. Sie geben einen Audiodateipfad an, wählen eine Modellgröße (Abwägung zwischen Geschwindigkeit und Genauigkeit) und legen ein Ausgabeformat fest. Das CLI verarbeitet die Audio und gibt die Transkription in das angegebene Verzeichnis aus.
Hauptfunktionen
--task translate FlagVoraussetzungen
Anwendungsfälle
Installation
npx clawhub@latest install openai-whispernpx clawhub@latest install openai-whisperBewertungen
0 BewertungenAnmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!