# 超级IP智能体 **Repository Path**: yuanma573/ip-human-agent ## Basic Information - **Project Name**: 超级IP智能体 - **Description**: 超级IP智能体4.0,集成云端算力调度、NLP、语音合成、数字人渲染、视频编辑、多平台发布等核心能力,仅需简单配置,即可一键完成「对标文案提取→文案仿写→声音克隆→数字人口播→字幕/背景音乐添加→标题/封面生成→多平台发布」全链路自动化。无需高性能本地设备支撑,低配电脑也能轻松驾驭,让你从繁琐的视频制作流程中解放出来,专注于内容策略,轻松批量产出符合平台算法偏好的爆款口播视频。 - **Primary Language**: Unknown - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 2 - **Created**: 2026-01-10 - **Last Updated**: 2026-03-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 轻语-超级IP智能体🚀 AI 数字人口播视频自动化生成工具 > 超级IP智能体 自动生成视频智能体 > > 一个 本地运行、模块化、可扩展 的 > 数字人口播视频生成与多平台发布自动化工程 ![UI 界面预览](show.png) --- ## 📌 项目简介 本项目2026款口播智能体4.0 专为解决这一痛点而生,集成 **云端算力调度**、NLP、语音合成、数字人渲染、视频编辑、多平台发布等核心能力,仅需简单配置,即可一键完成「对标文案提取→文案仿写→声音克隆→数字人口播→字幕/背景音乐添加→标题/封面生成→多平台发布」全链路自动化。**无需高性能本地设备支撑,低配电脑也能轻松驾驭**,让你从繁琐的视频制作流程中解放出来,专注于内容策略,轻松批量产出符合平台算法偏好的爆款口播视频。 --- ## 支持一键自动产出爆款视频 - 1.自动提取对标文案 - 2.自动进行文案仿写 - 3.自动根据文案声音克隆 - 4.自动生成数字人口播 - 5.自动添加字幕 - 6.自动添加背景音乐 - 7.自动添加视频标题 - 8.自动生成视频封面 - 9.自动将视频发布到各平台(某抖,某蝴蝶号、某手,某红书) --- ## ✨ 功能特性 * 自动提取并处理对标视频口播文案 * 文案语义级仿写与结构重组 * 高保真语音克隆与合成 * 数字人口播视频自动生成 * 自动生成字幕、背景音乐、标题与封面 * 多平台视频自动发布 * 全流程本地运行,无云端依赖 --- ## 🧠 自动化流程 ```text 对标文案提取 ↓ 文案仿写与优化 ↓ 语音合成 / 声音克隆 ↓ 数字人口播生成 ↓ 字幕 / BGM / 封面合成 ↓ 多平台发布 ``` --- ## 🧩 项目结构 项目采用 **模块化设计**,各功能模块解耦,便于替换与扩展: ```text project-root/ ├── script/ # 文案处理模块 │ ├── extractor/ # 对标文案提取 │ └── rewriter/ # 文案仿写 ├── audio/ # 音频处理模块 │ ├── asr/ # 语音识别(Whisper) │ └── tts/ # 语音合成(CosyVoice) ├── avatar/ # 数字人模块 │ └── heygem/ # 数字人驱动 ├── video/ # 视频后期模块 │ ├── subtitle/ # 字幕生成 │ ├── bgm/ # 背景音乐 │ └── ffmpeg/ # 视频合成流水线 ├── uploader/ # 发布模块 │ └── multi_platform/ # 多平台发布 └── client/ # 本地客户端 ``` --- ## 🔧 技术栈 | 模块 | 技术方案 | | ----- | --------------------------- | | 语音识别 | Whisper | | 语音合成 | CosyVoice | | 数字人驱动 | HeyGem | | 视频处理 | FFmpeg | | 自动发布 | 平台 API / social-auto-upload | --- ## 📦 安装说明 > 由于模型文件及依赖体积较大,项目资源拆分提供。 1. **下载项目源码** 详见:`代码地址.txt` 2. **安装运行环境** 按照:`使用前必装.txt` 进行依赖安装 3. **启动本地客户端** --- ## ▶️ 使用方式 当前版本通过 **本地客户端** 控制完整流水线,基本使用流程如下: 1. 配置对标内容或原始文案 2. 执行文案仿写模块 3. 选择语音与数字人 4. 生成口播视频 5. 自动完成字幕、BGM、封面 6. 选择平台进行发布 --- ## 🧪 设计原则 * **本地优先**:不依赖云端服务 * **模块解耦**:各模块可独立替换 * **流程可控**:每一步可单独调试 * **工程导向**:强调稳定性与可维护性 --- ## 📖 联系交流-799元购买成品软件、9.9元试用、白票勿扰 > 可联系交流wx: ![介绍图](https://gitee.com/yuanma573/ip-human-agent/raw/master/Contact_wx8.png) --- ## ⚠️ 已知限制 * 对硬件资源(尤其 GPU)有一定要求 * 不同平台上传接口可能存在变动 * 数字人口播效果依赖上游模型质量 --- ## 🤝 致谢 本项目基于以下优秀开源项目与工具构建,在此表示感谢: * [Whisper](https://github.com/openai/whisper) * [CosyVoice](https://github.com/tencent-ailab/cosyvoice) * [HeyGem](https://github.com/...) * [social-auto-upload](https://github.com/...) * FFmpeg --- ## 📄 使用限制与声明 * 本项目 **仅用于个人学习、研究和技术交流** * 🚫 禁止任何形式的商业用途 * 🚫 禁止基于本项目提供付费服务或二次分发 * 使用本项目产生的内容与风险由使用者自行承担 --- ## 📖 About 本仓库展示了一个 **完整、可运行的 AI 数字人口播视频自动化工程实现**,侧重 **系统集成与工程实践**。 适用于: * AI 视频方向技术学习 * 数字人系统原型验证 * 自动化内容生成流程研究 ---