# Whisper Live **Repository Path**: sunshinewithmoonlight/whisper-live ## Basic Information - **Project Name**: Whisper Live - **Description**: 基于 Whisper 的实时中文语音转录工具,支持 GPU 加速,智能分段,低延迟输出。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-02-19 - **Last Updated**: 2025-02-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Whisper Live ![运行示例](Example01.png) 基于 Whisper 的实时中文语音转录工具,支持 GPU 加速,智能分段,低延迟输出。 ## 功能特点 - 🚀 GPU 加速支持 - MacOS:使用 MLX 框架 - Windows:使用 CUDA - ⚡ 实时转录,低延迟输出 - 🎯 智能语音分段 - 🔧 可配置的分段参数 ## 安装依赖 ### MacOS ```bash pip install SpeechRecognition numpy webrtcvad opencc-python-reimplemented tqdm mlx-whisper mlx ``` ### Windows (需要 CUDA 支持) ```bash pip install SpeechRecognition numpy webrtcvad opencc-python-reimplemented tqdm faster-whisper ``` ## 使用方法 1. 基本使用: ```bash python whisper-live-main.py ``` 2. 显示详细信息: ```bash python whisper-live-main.py -v ``` ## 参数配置 可在源代码的 `if __name__ == "__main__":` 部分调整以下参数: ```python # 短停顿阈值(秒)- 建议范围:0.1-0.5秒 SHORT_PAUSE = 0.2 # 触发分段所需的最少短停顿次数 - 建议范围:2-5次 MIN_PAUSES = 3 # 长停顿阈值(秒)- 建议范围:1.0-3.0秒 LONG_PAUSE = 2.0 # 最大语音段长度(秒)- 建议范围:20.0-60.0秒 MAX_DURATION = 30.0 ``` ## 系统要求 - Python >= 3.8 - MacOS - Apple Silicon 或 Intel 处理器 - MLX 框架支持 - Windows - CUDA 支持的 NVIDIA GPU - CUDA 工具包 ## 常见问题 1. GPU 不可用时会自动切换到 CPU 模式 2. 使用 `-v` 参数可查看详细的调试信息 3. 按 Ctrl+C 可安全退出程序 ## 许可证 MIT License ## 致谢 - [OpenAI Whisper](https://github.com/openai/whisper) - [MLX](https://github.com/ml-explore/mlx) - [faster-whisper](https://github.com/guillaumekln/faster-whisper)