Openai Whisper
Transcribe archivos de audio localmente con Whisper de OpenAI — sin clave de API, compatible con múltiples idiomas y formatos de salida.
npx clawhub@latest install openai-whisperLa habilidad OpenAI Whisper permite a su asistente de IA transcribir archivos de audio a texto completamente en su máquina local. Utiliza el modelo Whisper de código abierto de OpenAI para convertir el habla de archivos de audio (MP3, M4A, WAV, etc.) en texto, subtítulos u otros formatos de salida. También admite la traducción de audio en idiomas distintos al inglés a texto en inglés. No se necesita clave API ni conexión a internet después de la descarga inicial del modelo.
Cómo funciona
La habilidad utiliza el CLI whisper, que ejecuta la red neuronal Whisper localmente en su máquina. En el primer uso, el modelo seleccionado se descarga en ~/.cache/whisper. Usted proporciona una ruta de archivo de audio, elige un tamaño de modelo (equilibrando velocidad vs. precisión) y especifica un formato de salida. El CLI procesa el audio y genera la transcripción en el directorio especificado.
Características principales
--task translateRequisitos
Casos de uso
Cómo instalar
npx clawhub@latest install openai-whispernpx clawhub@latest install openai-whisperReseñas
0 reseñasInicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!