# 字幕文本提取器 **Repository Path**: lovegitee/pub_zimu ## Basic Information - **Project Name**: 字幕文本提取器 - **Description**: 字幕提取器, 本工具基于 OpenAI 开源模型 Whisper 封装,遵循 MIT License。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-09-22 - **Last Updated**: 2025-10-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 📘 项目使用说明(字幕生成器)

本工具基于 OpenAI 开源模型 Whisper 封装,遵循 MIT License。

双击即用, 最简单的字幕生成器
对标剪映的识别字幕歌词 ![img_4.png](img_4.png) 1️⃣ 模型文件下载 首次使用前,请下载 Whisper 模型文件(.pt 格式): 🔗 官方地址: 👉 https://github.com/openai/whisper 🇨🇳 国内下载镜像(推荐): 📦 百度网盘:https://pan.baidu.com/s/1xfurcZC4Ctv3CDUNLBiQ5A?pwd=3sb5 提取码: 3sb5 2️⃣ 模型文件放置说明 请将下载的模型文件(.pt)放置于程序所在目录下的 model 文件夹中; 第一次使用建议下载small.pt先测试一下 追求高精度的话, 建议用lager-v3.pt模型 若 model 文件夹不存在,程序将自动创建; 模型文件命名应保持原始格式,例如:tiny.pt, base.en.pt 等。 3️⃣ 启动程序 双击运行 字幕生成器.exe(首次启动可能略慢,属正常现象); 项目为 离线独立运行包,无需联网即可使用; 支持 Windows 10 及以上版本。 4️⃣ 功能说明 📂 支持选择音视频文件(支持常见格式如 .mp3, .mp4, .wav, .mov 等); 📤 支持输出多种字幕格式: SRT, TXT, VTT, JSON 5️⃣ 项目的开源地址: gitee : https://gitee.com/lovegitee/pub_zimu github : https://github.com/shenshi256/pub_zimu 🌐 可选项: ✅ 是否简体中文输出(适用于非中语音转写场景) 🐞 是否开启调试模式(输出详细日志) 🔁 实时显示转写进度与日志,便于观察运行状态 5️⃣ 使用说明与免责声明 本项目基于 OpenAI 开源模型 Whisper 开发; 本软件为个人开发工具,免费使用, 如果对您有帮助,请给作者赏杯咖啡; 严禁用于一切非法用途,开发者不对任何使用结果或法律风险承担责任; 请勿用于商业传播、隐私监听、违法活动等用途; ⚠️ 注意事项 ⏳ 首次启动可能稍慢,耐心等待初始化; 💾 请确保有足够的磁盘空间保存转写文件; 🧠 建议使用 64 位操作系统并预留充足内存(详见模型帮助说明); 🛠 遇到问题时,可尝试开启调试模式查看详细错误信息; 📥 输出结果存放于与音视频文件相同目录下,命名一致,仅扩展名不同; # 觉得有帮助请赏杯咖啡 ![img.png](img.png) # 效果图 ![img_1.png](img_1.png) ![img_2.png](img_2.png)