📋

Openai Whisper

Transcribe archivos de audio localmente con Whisper de OpenAI — sin clave de API, compatible con múltiples idiomas y formatos de salida.

Peter Steinbergerv1.0.0
Productivity & TasksProductivityAI PoweredCLI
Conectando a la VM...
Conectando a la VM...
npx clawhub@latest install openai-whisper
161Estrellas
31.4kDescargas
35Instalaciones actuales
832Instalaciones totales
v1.0.0Versión
Feb 26, 2026Actualizado

La habilidad OpenAI Whisper permite a su asistente de IA transcribir archivos de audio a texto completamente en su máquina local. Utiliza el modelo Whisper de código abierto de OpenAI para convertir el habla de archivos de audio (MP3, M4A, WAV, etc.) en texto, subtítulos u otros formatos de salida. También admite la traducción de audio en idiomas distintos al inglés a texto en inglés. No se necesita clave API ni conexión a internet después de la descarga inicial del modelo.

Cómo funciona

La habilidad utiliza el CLI whisper, que ejecuta la red neuronal Whisper localmente en su máquina. En el primer uso, el modelo seleccionado se descarga en ~/.cache/whisper. Usted proporciona una ruta de archivo de audio, elige un tamaño de modelo (equilibrando velocidad vs. precisión) y especifica un formato de salida. El CLI procesa el audio y genera la transcripción en el directorio especificado.

Características principales

Procesamiento local
Toda la transcripción se ejecuta en su máquina sin clave API ni dependencia en la nube
Múltiples tamaños de modelos
Elija entre modelos tiny y large según sus necesidades de velocidad vs. precisión (por defecto: turbo)
Soporte de traducción
Traduzca audio en idiomas distintos al inglés directamente a texto en inglés usando el indicador --task translate
Múltiples formatos de salida
Salida como texto plano (txt), subtítulos SubRip (srt) y otros formatos
Amplio soporte de formatos de audio
Compatible con MP3, M4A, WAV y otros formatos de audio comunes

Requisitos

Whisper CLI
El paquete OpenAI Whisper debe estar instalado. Instalable a través de Homebrew

Casos de uso

Transcripción de reuniones
Convierta reuniones o llamadas grabadas en documentos de texto con capacidad de búsqueda
Generación de subtítulos
Genere archivos de subtítulos SRT a partir de grabaciones de video o audio
Creación de contenido
Transcriba entrevistas, podcasts o conferencias para contenido escrito
Traducción multilingüe
Traduzca grabaciones de audio en idiomas extranjeros a texto en inglés

Cómo instalar

1
Run in your terminal
npx clawhub@latest install openai-whisper
or
2
Click the Install button at the top of this page for one-click setup

Reseñas

0 reseñas

Inicia sesión para escribir una reseña

Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!