# pets3-learn **Repository Path**: qming/pets3-learn ## Basic Information - **Project Name**: pets3-learn - **Description**: pets3-learn - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-11 - **Last Updated**: 2026-01-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PETS-3 核心词汇『流式』学习系统 (PETS-3 Stream Loader) ## 📖 项目介绍 **PETS-3 Stream Loader (P3-SL)** 是一个专为 PETS-3(全国公共英语等级考试三级)备考者设计的硬核辅助工具。 本项目的核心目标是将历年真题中出现率极高的 **4000 个核心高频词汇**,通过**结构化数据**、**AI 语音合成**和**自动化视频生成**技术,像“流式传输”一样高效地“下载”到用户的长期记忆中。 ## ✨ 核心特性 - **📚 结构化数据源**: 采用标准化的 Markdown 表格管理词汇数据,包含单词、音标、释义、常用词组、记忆短句及真题例句。 - **🗣️ AI 语音合成**: 集成 **F5-TTS** 技术,批量生成高质量、自然的单词发音音频。 - **🎬 自动化视频**: 基于 MoviePy 的视频生成引擎,一键将词汇表转换为精美的单词卡片视频,支持移动端竖屏观看。 - **🚀 批量处理**: 支持断点续传和批量处理,轻松应对数千个词汇的音视频生成任务。 ## 📁 项目结构 ``` d:\kenzhao\cust_projects\pets3-learn\ ├── 英语单词核心词汇/ # 核心数据源 (Markdown 格式) │ ├── 高频词_1.md │ ├── ... │ └── 高频词_x.md ├── 单词卡视频v3/ # 最新版视频生成引擎 │ ├── batch_audio.py # 批量音频生成脚本 │ ├── make_video.py # 视频合成脚本 │ ├── run_all.py # 一键运行入口 │ ├── audio_output/ #生成的音频文件 │ └── video_output/ #生成的视频文件 ├── ff5tts/ # F5-TTS 集成模块 └── .gitignore # Git 忽略配置 ``` ## 🛠️ 安装教程 ### 前置要求 1. **Python 3.8+**: 确保已安装 Python 环境。 2. **ImageMagick**: 用于视频中的文本渲染 (必须安装并配置环境变量)。 3. **F5-TTS 服务**: 本地或远程部署的 F5-TTS Gradio 服务。 ![alt text](image.png) ### 环境配置 ```bash # 克隆仓库 git clone https://gitee.com/your-repo/pets3-learn.git # 进入项目目录 cd pets3-learn # 安装依赖 (建议使用 conda 或 venv) pip install -r requirements.txt # 注意: 需要安装 gradio_client, moviepy 等库 ``` ## 🚀 快速开始 ### 1. 准备数据 在 `英语单词核心词汇` 目录下创建或编辑 Markdown 文件 (如 `高频词_1.md`),格式如下: | 编号 | 单词 | 音标 | 释义 | 常用词组 | 记忆短句 | 真题例句 | |------|------|------|------|----------|----------|----------| | 01 | Abandon | [ə'bændən] | v. 放弃 | abandon oneself to | Don't abandon hope. | The sailors had to abandon... | ### 2. 启动 F5-TTS 服务 确保 F5-TTS 服务正在运行,默认地址为 `http://127.0.0.1:7860/`。 ### 3. 生成视频 (v3 版本) ```bash cd 单词卡视频v3 # 方式一:一键运行 (推荐) # 依次执行音频生成和视频合成 python run_all.py # 方式二:分步执行 # 1. 生成音频 python batch_audio.py # 2. 合成视频 python make_video.py ``` 对比数据 项目 耗时 提升 高频词1(原版) 80分钟 基准 高频词2(优化) 53分钟 34% 高频词3(GPU) ~10分钟 8倍 生成结果将保存在 `单词卡视频v3/video_output/` 目录下。 ## 🤝 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request ## 📄 版权说明 本项目旨在辅助英语学习,部分词汇数据来源于历年真题,仅供个人学习使用。 ``` conda create -n f5-tts python=3.11 conda activate f5-tts # Install FFmpeg if you haven't yet conda install ffmpeg pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128 #pip install torch==2.8.0+cu128 torchaudio==2.8.0+cu128 --extra-index-url https://download.pytorch.org/whl/cu128 pip install -e . # Launch a Gradio app (web interface) f5-tts_infer-gradio# Specify the port/host f5-tts_infer-gradio --port 7860 --host 0.0.0.0# Launch a share link f5-tts_infer-gradio --share 这个启动的区别 ```