📋

Openai Whisper

使用 OpenAI 的 Whisper 語音轉文字模型在本機轉錄音訊檔案——無需 API 金鑰,支援多種語言和輸出格式。

Peter Steinbergerv1.0.0
Productivity & TasksProductivityAI PoweredCLI
正在連線至 VM...
正在連線至 VM...
npx clawhub@latest install openai-whisper
161Star 數
31.4k下載次數
35目前安裝數
832累計安裝數
v1.0.0版本
Feb 26, 2026更新時間

OpenAI Whisper 技能讓您的 AI 助手能夠完全在本地機器上將音訊檔案轉錄為文字。它使用 OpenAI 的開源 Whisper 模型將音訊檔案(MP3、M4A、WAV 等)中的語音轉換為文字、字幕或其他輸出格式。還支援將非英語音訊翻譯為英語文字。初始模型下載後無需 API 金鑰或網路連線。

運作原理

該技能使用 whisper CLI,在您的本地機器上執行 Whisper 神經網路。首次使用時,所選模型將下載至 ~/.cache/whisper。您提供音訊檔案路徑,選擇模型大小(在速度與準確性之間取得平衡),並指定輸出格式。CLI 處理音訊並將轉錄內容輸出至指定目錄。

核心功能

本地處理
所有轉錄均在您的機器上執行,無需 API 金鑰或雲端依賴
多種模型大小
根據速度與準確性需求從 tiny 到 large 模型中選擇(預設為 turbo)
翻譯支援
使用 --task translate 旗標將非英語音訊直接翻譯為英語文字
多種輸出格式
以純文字(txt)、SubRip 字幕(srt)等格式輸出
廣泛的音訊格式支援
支援 MP3、M4A、WAV 及其他常見音訊格式

系統需求

Whisper CLI
必須安裝 OpenAI Whisper 套件,可透過 Homebrew 安裝

使用情境

會議轉錄
將錄製的會議或通話轉換為可搜尋的文字文件
字幕產生
從影片或音訊錄製中產生 SRT 字幕檔案
內容創作
轉錄訪談、Podcast 或講座以產生書面內容
多語言翻譯
將外語音訊錄製翻譯為英語文字

安裝方式

1
Run in your terminal
npx clawhub@latest install openai-whisper
or
2
Click the Install button at the top of this page for one-click setup

評價

0 則評價

登入後撰寫評價

尚無評價。來分享你的使用體驗吧!