# pets3-learn

**Repository Path**: qming/pets3-learn

## Basic Information

- **Project Name**: pets3-learn
- **Description**: pets3-learn
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-11
- **Last Updated**: 2026-01-18

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# PETS-3 核心词汇『流式』学习系统 (PETS-3 Stream Loader)

## 📖 项目介绍

**PETS-3 Stream Loader (P3-SL)** 是一个专为 PETS-3（全国公共英语等级考试三级）备考者设计的硬核辅助工具。

本项目的核心目标是将历年真题中出现率极高的 **4000 个核心高频词汇**，通过**结构化数据**、**AI 语音合成**和**自动化视频生成**技术，像“流式传输”一样高效地“下载”到用户的长期记忆中。

## ✨ 核心特性

- **📚 结构化数据源**: 采用标准化的 Markdown 表格管理词汇数据，包含单词、音标、释义、常用词组、记忆短句及真题例句。
- **🗣️ AI 语音合成**: 集成 **F5-TTS** 技术，批量生成高质量、自然的单词发音音频。
- **🎬 自动化视频**: 基于 MoviePy 的视频生成引擎，一键将词汇表转换为精美的单词卡片视频，支持移动端竖屏观看。
- **🚀 批量处理**: 支持断点续传和批量处理，轻松应对数千个词汇的音视频生成任务。

## 📁 项目结构

```
d:\kenzhao\cust_projects\pets3-learn\
├── 英语单词核心词汇/       # 核心数据源 (Markdown 格式)
│   ├── 高频词_1.md
│   ├── ...
│   └── 高频词_x.md
├── 单词卡视频v3/           # 最新版视频生成引擎
│   ├── batch_audio.py     # 批量音频生成脚本
│   ├── make_video.py      # 视频合成脚本
│   ├── run_all.py         # 一键运行入口
│   ├── audio_output/      #生成的音频文件
│   └── video_output/      #生成的视频文件
├── ff5tts/                # F5-TTS 集成模块
└── .gitignore             # Git 忽略配置
```

## 🛠️ 安装教程

### 前置要求

1.  **Python 3.8+**: 确保已安装 Python 环境。
2.  **ImageMagick**: 用于视频中的文本渲染 (必须安装并配置环境变量)。
3.  **F5-TTS 服务**: 本地或远程部署的 F5-TTS Gradio 服务。
![alt text](image.png)
### 环境配置

```bash
# 克隆仓库
git clone https://gitee.com/your-repo/pets3-learn.git

# 进入项目目录
cd pets3-learn

# 安装依赖 (建议使用 conda 或 venv)
pip install -r requirements.txt
# 注意: 需要安装 gradio_client, moviepy 等库
```

## 🚀 快速开始

### 1. 准备数据

在 `英语单词核心词汇` 目录下创建或编辑 Markdown 文件 (如 `高频词_1.md`)，格式如下：

| 编号 | 单词 | 音标 | 释义 | 常用词组 | 记忆短句 | 真题例句 |
|------|------|------|------|----------|----------|----------|
| 01 | Abandon | [ə'bændən] | v. 放弃 | abandon oneself to | Don't abandon hope. | The sailors had to abandon... |

### 2. 启动 F5-TTS 服务

确保 F5-TTS 服务正在运行，默认地址为 `http://127.0.0.1:7860/`。

### 3. 生成视频 (v3 版本)

```bash
cd 单词卡视频v3

# 方式一：一键运行 (推荐)
# 依次执行音频生成和视频合成
python run_all.py

# 方式二：分步执行
# 1. 生成音频
python batch_audio.py
# 2. 合成视频
python make_video.py
```
对比数据
项目	耗时	提升
高频词1（原版）	80分钟	基准
高频词2（优化）	53分钟	34%
高频词3（GPU）	~10分钟	8倍
生成结果将保存在 `单词卡视频v3/video_output/` 目录下。

## 🤝 参与贡献

1.  Fork 本仓库
2.  新建 Feat_xxx 分支
3.  提交代码
4.  新建 Pull Request

## 📄 版权说明

本项目旨在辅助英语学习，部分词汇数据来源于历年真题，仅供个人学习使用。

```
conda create -n f5-tts python=3.11
conda activate f5-tts

# Install FFmpeg if you haven't yet
conda install ffmpeg

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

#pip install torch==2.8.0+cu128 torchaudio==2.8.0+cu128 --extra-index-url https://download.pytorch.org/whl/cu128
pip install -e .
# Launch a Gradio app (web interface)
f5-tts_infer-gradio# Specify the port/host
f5-tts_infer-gradio --port 7860 --host 0.0.0.0# Launch a share link
f5-tts_infer-gradio --share

这个启动的区别
```