# 字幕文本提取器
**Repository Path**: lovegitee/pub_zimu
## Basic Information
- **Project Name**: 字幕文本提取器
- **Description**: 字幕提取器, 本工具基于 OpenAI 开源模型 Whisper 封装,遵循 MIT License。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-09-22
- **Last Updated**: 2025-10-24
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
📘 项目使用说明(字幕生成器)
本工具基于 OpenAI 开源模型 Whisper 封装,遵循 MIT License。
双击即用, 最简单的字幕生成器
对标剪映的识别字幕歌词

1️⃣ 模型文件下载
首次使用前,请下载 Whisper 模型文件(.pt 格式):
🔗 官方地址:
👉 https://github.com/openai/whisper
🇨🇳 国内下载镜像(推荐):
📦 百度网盘:https://pan.baidu.com/s/1xfurcZC4Ctv3CDUNLBiQ5A?pwd=3sb5 提取码: 3sb5
2️⃣ 模型文件放置说明
请将下载的模型文件(.pt)放置于程序所在目录下的 model 文件夹中;
第一次使用建议下载small.pt先测试一下
追求高精度的话, 建议用lager-v3.pt模型
若 model 文件夹不存在,程序将自动创建;
模型文件命名应保持原始格式,例如:tiny.pt, base.en.pt 等。
3️⃣ 启动程序
双击运行 字幕生成器.exe(首次启动可能略慢,属正常现象);
项目为 离线独立运行包,无需联网即可使用;
支持 Windows 10 及以上版本。
4️⃣ 功能说明
📂 支持选择音视频文件(支持常见格式如 .mp3, .mp4, .wav, .mov 等);
📤 支持输出多种字幕格式:
SRT, TXT, VTT, JSON
5️⃣ 项目的开源地址:
gitee : https://gitee.com/lovegitee/pub_zimu
github : https://github.com/shenshi256/pub_zimu
🌐 可选项:
✅ 是否简体中文输出(适用于非中语音转写场景)
🐞 是否开启调试模式(输出详细日志)
🔁 实时显示转写进度与日志,便于观察运行状态
5️⃣ 使用说明与免责声明
本项目基于 OpenAI 开源模型 Whisper 开发;
本软件为个人开发工具,免费使用, 如果对您有帮助,请给作者赏杯咖啡;
严禁用于一切非法用途,开发者不对任何使用结果或法律风险承担责任;
请勿用于商业传播、隐私监听、违法活动等用途;
⚠️ 注意事项
⏳ 首次启动可能稍慢,耐心等待初始化;
💾 请确保有足够的磁盘空间保存转写文件;
🧠 建议使用 64 位操作系统并预留充足内存(详见模型帮助说明);
🛠 遇到问题时,可尝试开启调试模式查看详细错误信息;
📥 输出结果存放于与音视频文件相同目录下,命名一致,仅扩展名不同;
# 觉得有帮助请赏杯咖啡

# 效果图

