# 字幕文本提取器 **Repository Path**: lovegitee/pub_zimu ## Basic Information - **Project Name**: 字幕文本提取器 - **Description**: 字幕提取器, 本工具基于 OpenAI 开源模型 Whisper 封装，遵循 MIT License。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-09-22 - **Last Updated**: 2025-10-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 📘 项目使用说明（字幕生成器）

本工具基于 OpenAI 开源模型 Whisper 封装，遵循 MIT License。

双击即用, 最简单的字幕生成器

对标剪映的识别字幕歌词 ![img_4.png](img_4.png) 1️⃣ 模型文件下载首次使用前，请下载 Whisper 模型文件（.pt 格式）： 🔗 官方地址： 👉 https://github.com/openai/whisper 🇨🇳 国内下载镜像（推荐）： 📦 百度网盘：https://pan.baidu.com/s/1xfurcZC4Ctv3CDUNLBiQ5A?pwd=3sb5 提取码: 3sb5 2️⃣ 模型文件放置说明请将下载的模型文件（.pt）放置于程序所在目录下的 model 文件夹中；第一次使用建议下载small.pt先测试一下追求高精度的话, 建议用lager-v3.pt模型若 model 文件夹不存在，程序将自动创建；模型文件命名应保持原始格式，例如：tiny.pt, base.en.pt 等。 3️⃣ 启动程序双击运行字幕生成器.exe（首次启动可能略慢，属正常现象）；项目为离线独立运行包，无需联网即可使用；支持 Windows 10 及以上版本。 4️⃣ 功能说明 📂 支持选择音视频文件（支持常见格式如 .mp3, .mp4, .wav, .mov 等）； 📤 支持输出多种字幕格式： SRT, TXT, VTT, JSON 5️⃣ 项目的开源地址: gitee : https://gitee.com/lovegitee/pub_zimu github : https://github.com/shenshi256/pub_zimu 🌐 可选项： ✅ 是否简体中文输出（适用于非中语音转写场景） 🐞 是否开启调试模式（输出详细日志） 🔁 实时显示转写进度与日志，便于观察运行状态 5️⃣ 使用说明与免责声明本项目基于 OpenAI 开源模型 Whisper 开发；本软件为个人开发工具，免费使用, 如果对您有帮助，请给作者赏杯咖啡；严禁用于一切非法用途，开发者不对任何使用结果或法律风险承担责任；请勿用于商业传播、隐私监听、违法活动等用途； ⚠️ 注意事项 ⏳ 首次启动可能稍慢，耐心等待初始化； 💾 请确保有足够的磁盘空间保存转写文件； 🧠 建议使用 64 位操作系统并预留充足内存（详见模型帮助说明）； 🛠 遇到问题时，可尝试开启调试模式查看详细错误信息； 📥 输出结果存放于与音视频文件相同目录下，命名一致，仅扩展名不同； # 觉得有帮助请赏杯咖啡 ![img.png](img.png) # 效果图 ![img_1.png](img_1.png) ![img_2.png](img_2.png)