# 智剧通 **Repository Path**: jeffstric/zjt ## Basic Information - **Project Name**: 智剧通 - **Description**: 智剧通 - AI 视频制作平台 用 AI 智能体协同,让零基础创作者快速生成专业级短剧 一站式剧本创作→分镜生成→视频合成解决方案 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-05-07 - **Last Updated**: 2026-05-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 🎬 智剧通 - AI 短剧制作平台 > 用 AI 智能体协同,让零基础创作者快速生成专业级短剧 > 一站式剧本创作→分镜生成→视频合成解决方案 ![智剧通](files/广告图.png) [English](README_EN.md) | 中文 | [在线体验](http://ailive.perseids.cn) | [完整教程](https://bq3mlz1jiae.feishu.cn/wiki/W1h2wCK3mi1CgDk36LEcVqggnLe) --- ## ✨ 核心特性 | 🤖 AI 智能体协同 | 🎨 专业分镜设计 | 📹 一键生成短剧 | 🌍 多模型支持 | |:---:|:---:|:---:|:---:| | 8个专家智能体分工协作,ask_user 工具与用户交互 | 无限画布 + 多宫格分镜设计 | 自动剧本→分镜→视频生成 | 支持 10+ LLM,灵活切换 | | 👥 团队无限协作 | 💰 灵活计算力管理 | 🔒 商业级稳定性 | 📦 开箱即用 | |:---:|:---:|:---:|:---:| | 浏览器端协作,支持局域网和公网 | 用户级独立账户,支持用户选择模型 | 全接口单元测试,线上运营验证 | 内置图床、提示词库、TTS 服务 | | 🖥️ 跨平台支持 | 🐳 Docker 部署 | 🧪 完整测试覆盖 | 🎓 教培专用 | |:---:|:---:|:---:|:---:| | Windows / Linux / macOS 原生支持 | 容器化部署 | 全接口单元测试,生产可信 | 用户级算力管理,成本透明 | --- ## 🚀 快速开始 ### 在线体验(无需安装)✨ 👉 **[ailive.perseids.cn](http://ailive.perseids.cn)** - 立即体验完整功能(无需任何配置和安装) --- ### Windows 用户(推荐)⭐ 📥 **从 GitHub Release 页面下载最新的 "点我启动.exe"** 👉 [github.com/jeffstric/ZJT/releases](https://github.com/jeffstric/ZJT/releases) ```bash # 1. 下载已编译的可执行文件 从 Release 页面下载最新的 "点我启动.exe" # 2. 双击运行(一键启动) 点我启动.exe # 3. 等待启动完成 ✅ 系统托盘图标显示启动状态 ✅ 浏览器自动打开 ✅ 访问 http://localhost:9003/ # 4. 右键菜单功能 打开浏览器 | 查看日志 | 退出 ``` ### macOS 用户(推荐)⭐ 📥 **从 GitHub Release 页面下载最新的压缩包并解压** 👉 [github.com/jeffstric/ZJT/releases](https://github.com/jeffstric/ZJT/releases) ```bash # 1. 解压下载的文件 unzip ZJT-mac.zip cd ZJT # 2. 双击启动脚本(一键启动) open start.command # 或使用命令行启动 bash start.command # 3. 等待启动完成 ✅ 浏览器自动打开 ✅ 访问 http://localhost:9003/ # 停止服务 bash stop.command ``` 📖 **详细配置说明**: 见 [docs/README.md](docs/README.md) ### Linux 用户 ```bash # 1. 克隆项目 git clone https://github.com/jeffstric/zjt cd zjt # 2. 配置数据库连接 cp config.example.yml config.prod.yml # 编辑 config.prod.yml,填写数据库连接信息 # 3. 安装依赖 uv sync # 4. 启动服务 python3 scripts/running/run_prod.py # 4. 访问浏览器 http://localhost:9003/ ``` ### Docker 部署(推荐用于服务器)🐳 ```bash # 1. 进入 Docker 目录 cd docker # 2. 启动容器 docker-compose up -d # 3. 查看日志 docker-compose logs -f # 4. 访问应用 http://localhost:9003/ # 常用命令 docker-compose down # 停止服务 docker-compose build # 重新构建镜像 docker-compose exec app bash # 进入容器 ``` ### 开发者本地启动 ```bash # 1. 设置开发环境 export comfyui_env="dev" uv sync # 2. 启动开发服务 python3 scripts/running/run_dev.py # 3. 查看 DEBUG 日志 http://localhost:9003/admin.html ``` --- ## 🚀 核心创新点 ### 1️⃣ 团队实时协同制作(零延迟协作) ![无限画布](files/无限画布.png) 智剧通 **打破传统单人创作模式**,实现真正的团队协同: - **浏览器端实时协作** - 无需安装任何插件,多人同时编辑剧本、分镜、角色档案 - **简洁的权限管理** - 管理员和普通用户两级权限体系 - **局域网 + 公网支持** - 支持本地团队在线协作,也支持全球远程制作 - **实时同步** - SSE 实时推送,编辑内容毫秒级同步 - **完整的工作流**:剧本智能体 → 无限画布 → 剪影草稿 **场景**:5 人内容创作团队,剧本作者、美术指导、编导可同时在线编辑,AI Agent 在后台并行生成分镜,效率提升 300%+ --- ### 2️⃣ 用户级独立算力账户(教培/团队成本管理革命) ![算力管理](files/算力.png) **传统方案**:一个平台账户,所有成员共享,成本无法管控 **智剧通方案**:每个用户独立算力账户,灵活、透明、可控 **核心能力**: - **用户级独立账户** - 每个学生/成员有独立的算力额度,互不影响 - **用户级供应商选择** - 多供应商冗余架构,确保创作不中断,无单点瓶颈 - **LLM 模型选择** - 高端用户选 Claude(功能调用强,主力模型) - 普通用户选 Qwen(中文理解优秀,性价比高) - 本地部署选 Ollama(零成本,隐私性强) - **生图/生视频供应商选择** - Nano、Banana 可从智剧通官网、多米、ComfyUI 等多渠道灵活切换 - 某一供应商故障时自动无缝切换,保证创作流程不间断 - **管理员热更新能力** - 平台管理员可实时更新: - 模型配置和价格 - 供应商优先级 - 用户配额和限额 - 无需重启,立即生效 - **平台级成本管理** - 管理员设置总预算,自动统计消耗,精确到分 - **支持微信支付** - 用户自助充值,随用随充,完全透明计费 **应用场景**: - 📚 **在线教育**:为 1000 个学生分配算力,每人 100 元额度,总成本可控 - 🏢 **企业培训**:不同部门不同额度,成本完全按部门分配 - 🎨 **创意工作室**:团队成员各自管理预算,做到成本透明、绩效挂钩 --- ### 🧠 AI 智能体系统 ![AI 智能体](files/智能体生成剧本.png) 智剧通 采用多智能体协作架构,由 **PM Agent(项目经理)** 和 **8 个 Expert Agents(专家团队)** 组成: #### 8 个专家智能体分工 | 角色 | 职责 | 能力 | |------|------|------| | **Story Writer** | 编写故事剧本、对话 | 智能大纲生成、对白编写、情感弧线设计 | | **Character Creator** | 创建人物设定、性格特征 | 角色档案生成、背景故事、角色 OOC 检查 | | **Location Creator** | 设计场景、背景、美术风格 | 场景设定、道具列表、视觉风格指导 | | **Plot Analyzer** | 分析情节、悬念、节奏 | 三幕式分析、悬念设置、节奏优化 | | **Content Compliance** | 审核内容合规性 | 自动检查违禁词、政策合规、内容安全 | | **Novel Splitter** | 小说改编、分集拆分 | 自动分集、章节对标、内容拆分 | | **Character Designer** | 角色形象设计 | 生成一致的角色参考图、风格统一 | | **Location Designer** | 场景道具设计 | 生成场景参考图、道具库建立 | #### 智能体与用户的互动 智能体支持 **ask_user 工具**,可主动向用户提问: ``` Expert: "正在设计主角...有以下几个方向:" 1️⃣ 古装美女(气质优雅) 2️⃣ 现代OL(干练职场) 3️⃣ 青春少女(可爱活力) 用户选择 → Expert 继续 → 结果精准,无需反复修改 ``` --- ## 🎯 完整创作流程 ![全流程自动化](files/工作流.png) ![时间轴](files/时间轴.png) ### 从剧本到成片的全自动化 ``` 第一步:创作初稿 ↓ 输入:故事概念、目标用户、风格偏好 ↓ PM Agent 分析需求 ↓ Story Writer 编写故事大纲 ↓ 输出:5000+ 字完整剧本 第二步:角色与场景设计 ↓ 同步进行,智能体并行工作 ↓ Character Creator:8 个人物设定 ↓ Location Creator:12+ 个场景描述 ↓ 输出:完整世界观档案 第三步:内容审核与优化 ↓ Content Compliance 检查合规性 ↓ Plot Analyzer 优化情节节奏 ↓ 输出:审核通过的最终剧本 第四步:智能分镜生成 ↓ 自动拆分剧本为 30-60 个镜头节点 ↓ 自动提取分镜提示词(场景、动作、表情) ↓ 智能匹配场景、角色、道具 ↓ 输出:完整分镜清单 第五步:分镜图生成 ↓ 4 宫格自动布局,保证分镜一致性 ↓ 角色形象锁定,解决"脸崩"问题 ↓ 支持多风格生成(3D、二次元、真人等) ↓ 输出:80+ 张一致的分镜参考图 第六步:视频合成 ↓ 工作流处理:通过 API 调度生成视频 ↓ 支持 RunningHub、Duomi、Vidu 等多个 API ↓ 工作流处理:TTS 语音 + 背景音乐合成 ↓ 输出:完整的 MP4 短剧视频 ``` > 💡 **实战经验提示**:视频和音效处理采用**工作流处理而非完全自动生成**,这是基于红果平台线上运营经验的关键决策。通过工作流处理可以: > - ✅ 保证视频/音效的质量稳定性 > - ✅ 支持多个 API 的灵活切换和容错 > - ✅ 实现精细化的参数调整 > - ✅ 提供更好的生成可控性 ### 自动化程度对比 | 传统方式 | 智剧通 | |---------|--------| | 手写剧本(8-16 小时) | AI 生成剧本(10 分钟)+ ask_user 优化 | | 手绘分镜(16-24 小时) | 自动生成分镜清单(5 分钟)| | 手配参考图(8-12 小时) | AI 一键生成 80+ 参考图(15 分钟)| | 视频合成与音效(6-10 小时) | 自动合成(30 分钟)| | **总耗时:38-62 小时** | **总耗时:1-2 小时** | --- ## 🎨 专业创作工具 ![无限画布](files/无限画布.png) ### 1. 无限画布编辑器 - 灵活的镜头编排空间 - 支持拖拽、调整、组织 - 实时预览 + 多宫格布局 - 专业级创作体验 ### 2. 多宫格分镜设计 - 自动 2x2、3x3 等多宫格布局 - 分镜一致性保证(同一角色形象统一) - 支持局部编辑和刷新 - 智能流程优化,节省算力 50%+ ### 3. 团队无限协作 - 浏览器端直接使用,无需安装 - 支持局域网部署和公网远程协作 - 实时同步 SSE 推送 - **权限管理**:管理员和普通用户两级 ### 4. 灵活的计算力管理(🎓 特别适合教培场景) ![算力管理](files/算力.png) - **用户级别独立算力账户** - 每个学生/学员独立计费,互不影响 - **用户级别供应商选择** - 多供应商冗余架构,LLM 和生图/生视频可分别灵活选择,确保创作不中断 - **管理员热更新能力** - 平台管理员可实时更新: - 模型配置和价格 - 供应商优先级 - 用户配额和限额 - 无需重启,立即生效 - **支持微信支付集成** - 用户自助充值,随用随充 **适用场景**: - 📚 **在线教育平台**:为每个学生分配算力额度 - 🏢 **企业培训**:部门级别的算力管理和成本控制 - 🎨 **内容创作团队**:成员各自管理算力,成本透明 - 🚀 **创业孵化器**:为初创企业提供算力支持 ### 5. 开箱即用的资源库 - 精选提示词库(500+ 模板) - 内置免费图床(支持 CDN 加速) - TTS 语音服务(10+ 语言) - 随时扩展自定义资源 --- ## 🔧 技术栈与能力 ### LLM 多模型支持 | 模型供应商 | 支持模型 | 特色 | |-----------|--------|------| | **Claude** | Claude | 功能调用能力强 | | **Ollama** | Llama 2, Mistral, CodeLlama 等 | 本地部署,零成本 | | **阿里通义千问** | qwen-turbo, qwen-plus | 🔥 主力模型,中文理解优秀 | | **豆包** | Doubao 系列 | 中文原生支持 | | 更多... | VolcEngine, etc. | 持续扩展 | ### 视频生成 API | API | 特色 | 适用场景 | |-----|------|--------| | **RunningHub** | 高质量、稳定 | 专业视频制作 | | **火山引擎** | 支持Seedance2.0 | 参考图转视频 | | **Vidu** | 文生视频 + 图生视频 | 全能选手 | ### 核心工具集(50+ 工具) **数据管理工具** - 创建/读取/更新 世界、角色、剧本、场景、道具 - 文件同步与持久化 - 完整的版本管理 **AI 生成工具** - 文生图(单张 + 4宫格) - 角色 4宫格生成 - 场景/道具 4宫格生成 - 支持参考图上传与提示词 --- ## 📊 系统架构 ### 分层架构 ``` ┌─────────────────────────────────────────────┐ │ Web UI (前端) │ │ • 脚本编辑器 │ │ • 无限画布 │ │ • 视频工作流 │ │ • 管理后台 │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ FastAPI Router (API) │ │ • /api/session - 会话管理 │ │ • /api/task - 任务管理 │ │ • /api/verification - 用户验证 │ │ • /api/world-files - 资源文件 │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ Business Logic (业务逻辑) │ │ • PM Agent / Expert Agents (LLM 智能体) │ │ • Task Manager (任务管理) │ │ • MCP Tool Executor (工具执行) │ │ • SSE Stream (实时推送) │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ MCP Tools (50+ 工具) │ │ • 数据管理、AI 生成、交互工具 │ │ • 与 LLM 无缝集成 │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ External Services (外部服务) │ │ • LLM APIs (Gemini, GPT, etc.) │ │ • Video APIs (RunningHub, Duomi, Vidu) │ │ • TTS 语音服务 │ │ • CDN & 存储 │ └─────────────────────────────────────────────┘ ``` ### 实时数据流 ``` 用户输入 → SSE Stream 连接 → PM Agent 分析 ↓ Expert Agents 执行 → 工具调用 ↓ ask_user 询问用户 (可选) ↓ 用户回答 → SSE 实时推送进度 ↓ 结果汇总 → 数据库持久化 ↓ 前端更新 UI 展示最终成果 ``` --- ## 🏆 技术亮点 | 特性 | 说明 | 优势 | |------|------|------| | **多智能体协同** | 8 个专家协作而非单个 AI | 输出质量 ↑50%,创意准度 ↑70% | | **ask_user 工具** | 智能体主动与用户交互 | 避免反复修改,一次成功率 ↑30% | | **实时 SSE 推送** | 流式任务进度反馈 | 用户感知时间 ↓60% | | **多模型支持** | 10+ LLM 灵活切换 | 成本控制 ↓40%,质量对标顶级模型 | | **自动分镜生成** | 智能拆分 + 提示词填充 | 工作量 ↓80% | | **角色形象锁定** | 分镜一致性保证 | 解决 AI 短剧的"脸崩"问题 | | **管理员热更新** | 实时更新模型配置、价格、优先级 | 无需重启,立即生效 | | **多平台支持** | Windows / Linux / macOS 原生支持 | 跨平台使用,一套代码多端运行 | | **Docker 部署** | 支持容器化部署 | 云端部署简化 | | **完整测试覆盖** | 全接口单元测试 | 核心功能覆盖,生产可信 | | **线上运营验证** | 红果平台短剧制作上线 | 真实场景考验,可信度 ⭐⭐⭐⭐⭐ | --- ## 💡 应用场景 ### 📱 内容创作者 - ✅ 快速生成爆款短剧脚本 - ✅ 通过 ask_user 优化创意方向 - ✅ 一键生成分镜和参考图 - ✅ 降低创作门槛和成本 ### 👥 团队协作 - ✅ 多人实时协作编辑 - ✅ 权限管理和版本控制 - ✅ 工作流透明化 - ✅ 支持局域网和公网部署 ### 🏢 企业应用 - ✅ 品牌视频快速制作 - ✅ 营销内容自动生成 - ✅ 成本控制(灵活计费) - ✅ 商业级稳定性保证 ### 🎓 教培/在线教育(特别推荐) - ✅ **为每个学生分配独立算力账户** - 学员可自主创作,成本透明 - ✅ **用户级别供应商选择** - 不同班级/学员可灵活选择供应商(降低成本或提升质量) - ✅ **管理员热更新能力** - 机构可动态调整模型配置、价格、优先级 - ✅ **平台级别成本管理** - 教培机构可配置总体算力预算 - ✅ **作品评估与反馈** - 完整的创作历史记录,便于师生互动 - ✅ **跨平台支持** - 学员可在 Windows/Mac/Linux 任何设备上创作 - ✅ **Docker 部署** - 机构可部署私有服务器,数据安全可控 **典型场景**: - 高中/大学传播系的短视频创作教学 - 在线创意写作培训课程 - 动画/游戏设计专业的分镜教学 - 内容创作从业者培训 --- ## 📈 数据与成果 ![实战验证](files/红果漫剧.png) ### 实战验证 - ✅ 已在红果平台完成短剧制作与上线 - ✅ 视频、图片生成稳定性经真实项目检验 - ✅ 用户反馈完播率 ↑30% vs 传统短剧 ### 工程质量 - ✅ 全接口单元测试覆盖 - ✅ 数据库迁移自动化 - ✅ 完整的配置管理体系 - ✅ 生产级错误处理 --- ## 📖 文档导航 ### 👤 用户指南 - 📌 [快速开始指南](docs/README.md#快速开始) - 📌 [功能完整教程](https://bq3mlz1jiae.feishu.cn/wiki/W1h2wCK3mi1CgDk36LEcVqggnLe) - 📌 [常见问题 (FAQ)](docs/README.md#常见问题) ### 👨‍💻 开发者指南 - 📌 [完整开发文档](docs/README.md) - 📌 [环境配置说明](docs/Windows启动开发说明.md) - 📌 [数据库迁移指南](docs/database_migration.md) - 📌 [API 文档](docs/backend/) ### 🏗️ 系统架构 - 📌 [视频工作流设计](docs/video_workflow_feedback.md) - 📌 [配置系统说明](docs/系统配置要求.md) ### 🔧 深度文章 - 📌 [短信驱动架构](docs/短信驱动架构说明.md) - 📌 [媒体缓存管理](docs/媒体文件缓存管理方案.md) - 📌 [常量使用示例](docs/常量使用示例.md) --- ## 📦 开源协议 本项目采用修改版 Apache License 2.0 协议,详见 [LICENSE](LICENSE)。 ### 核心条款 - ✅ **允许商业使用** - ✅ **允许修改和分发** - ✅ **允许私有部署** - ❌ **禁止运营多空间服务**(需授权) - ❌ **禁止移除前端 LOGO 和版权信息** --- ## 🤝 联系我们 ### 获取帮助 - 📧 **邮箱**:jeffstricg@gmail.com - 💬 **GitHub Issues**:[报告 Bug / 功能请求](https://github.com/jeffstric/zjt/issues) ### 加入社区 | 微信群 | 个人微信 | |:---:|:---:| | http://ailive.perseids.cn/upload/assert/wx_group.jpg | 个人二维码 | | 加入交流群 | 群加不了?扫码添加作者 | --- ## 🎉 核心特色总结 | 维度 | 智剧通 | 传统方案 | |------|--------|--------| | **创作速度** | 1-2 小时 | 38-62 小时 | | **创意质量** | AI 协同 + ask_user | 人工创意 | | **技术门槛** | 零基础可上手 | 需要专业美术 | | **部署难度** | 一键启动(Windows) | 需要复杂配置 | | **成本** | 灵活计费,可控制 | 高固定成本 | | **稳定性** | 全接口单元测试覆盖 | 人工依赖 | | **扩展性** | 支持 10+ LLM + API | 单一工具 | --- © 2026 智剧通. All rights reserved.