📋

Openai Whisper

使用 OpenAI 的 Whisper 语音转文字模型在本地转录音频文件——无需 API 密钥,支持多种语言和输出格式。

Peter Steinbergerv1.0.0
Productivity & TasksProductivityAI PoweredCLI
正在连接 VM...
正在连接 VM...
npx clawhub@latest install openai-whisper
161Star 数
31.4k下载次数
35当前安装数
832累计安装数
v1.0.0版本
Feb 26, 2026更新时间

OpenAI Whisper 技能让您的 AI 助手能够完全在本地机器上将音频文件转录为文本。它使用 OpenAI 的开源 Whisper 模型将音频文件(MP3、M4A、WAV 等)中的语音转换为文本、字幕或其他输出格式。还支持将非英语音频翻译为英语文本。初始模型下载后无需 API 密钥或网络连接。

工作原理

该技能使用 whisper CLI,在您的本地机器上运行 Whisper 神经网络。首次使用时,所选模型将下载到 ~/.cache/whisper。您提供音频文件路径,选择模型大小(在速度与准确性之间权衡),并指定输出格式。CLI 处理音频并将转录内容输出到指定目录。

核心功能

本地处理
所有转录均在您的机器上运行,无需 API 密钥或云端依赖
多种模型大小
根据速度与准确性需求从 tiny 到 large 模型中选择(默认为 turbo)
翻译支持
使用 --task translate 标志将非英语音频直接翻译为英语文本
多种输出格式
以纯文本(txt)、SubRip 字幕(srt)等格式输出
广泛的音频格式支持
支持 MP3、M4A、WAV 及其他常见音频格式

系统要求

Whisper CLI
必须安装 OpenAI Whisper 包,可通过 Homebrew 安装

使用场景

会议转录
将录制的会议或通话转换为可搜索的文本文档
字幕生成
从视频或音频录制中生成 SRT 字幕文件
内容创作
转录采访、播客或讲座以生成书面内容
多语言翻译
将外语音频录制翻译为英语文本

安装方式

1
Run in your terminal
npx clawhub@latest install openai-whisper
or
2
Click the Install button at the top of this page for one-click setup

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧!