# Fun-ASR-Nano **Repository Path**: dlp/fun-asr-nano ## Basic Information - **Project Name**: Fun-ASR-Nano - **Description**: Fun-ASR-Nano Web Demo。原始代码来自 https://www.modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano.git - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2026-03-19 - **Last Updated**: 2026-03-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Fun-ASR-Nano 一个基于 Gradio 的轻量级语音识别 (ASR) 应用,集成了 Fun-ASR-Nano 和 SenseVoice 等先进的语音识别模型。 官方项目地址: https://github.com/modelscope/FunASR/ https://www.modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano ## 功能特性 - **多模型支持**: - Fun-ASR-Nano:支持 50+ 种语言和中文方言的大语言模型 ASR - SenseVoice:基于 CTC 的 ASR 模型,内置 VAD(语音活动检测) - **多种输入方式**: - 上传音频文件 - 录制音频 - 音频 URL 输入 - **灵活配置**: - 支持代理设置 - 可选下载方法 - 支持音频片段选择 - 详细日志输出 - **用户友好的界面**: - 直观的 Gradio Web 界面 - 实时进度显示 - 可下载转录结果 ## 安装步骤 ### 1. 安装系统依赖 确保您的系统已安装以下工具: ```bash # 使用 Homebrew (macOS) brew install ffmpeg aria2 wget # 使用 apt (Ubuntu/Debian) sudo apt-get update sudo apt-get install ffmpeg aria2 wget ``` ### 2. 安装 Python 依赖 ```bash # 创建并激活虚拟环境(可选但推荐) python3 -m venv venv source venv/bin/activate # macOS/Linux # 安装 Python 包 pip install -r requirements.txt ``` ## 使用方法 ### 1. 启动应用 ```bash python app.py ``` 应用将在 http://localhost:7860 启动。 ### 2. 使用界面 1. **选择输入方式**: - 点击 "Upload or Record Audio" 上传或录制音频 - 或在 "Audio URL" 字段中输入音频文件的 URL 2. **配置选项**: - 选择管道类型(Fun-ASR-Nano 或 SenseVoice) - 选择具体模型 - 根据需要设置代理 3. **开始转录**: - 点击 "Transcribe" 按钮开始语音识别 - 等待处理完成,查看转录结果 - 可下载转录文本文件 ## 支持的语言 - **Fun-ASR-Nano**:50+ 种语言和中文方言 - **SenseVoiceSmall**:中文(zh)、英文(en)、粤语(yue)、日语(ja)、韩语(ko) ## 项目结构 ``` Fun-ASR-Nano/ ├── app.py # 主应用程序 ├── requirements.txt # Python 依赖 ├── packages.txt # 系统依赖 ├── Fun-ASR/ # 模型相关代码 │ ├── ctc.py │ └── model.py └── .gitignore ``` ## 注意事项 - 首次使用时,应用会自动下载所需的模型文件,可能需要一些时间 - 建议使用稳定的网络连接,特别是在下载模型时 - 对于大型音频文件,转录时间可能会较长 - 开发环境中使用 `debug=True` 可以获得更详细的错误信息,但在生产环境中应关闭 ## 许可证 [MIT License](LICENSE)