# SlideBot-AI **Repository Path**: uai-team/SlideBot-AI ## Basic Information - **Project Name**: SlideBot-AI - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-26 - **Last Updated**: 2026-02-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
SlideBot AI Logo # SlideBot AI 2.0 ### 智能演示文稿生成平台 *曾用名:SlideFlow AI(截图与视频中可能显示旧名称)* ### 🏢 源自真实商业场景,经过企业级用户打磨验证 **输入主题、大纲或素材,AI 帮你生成专业演示文稿** [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) [![Python](https://img.shields.io/badge/Python-3.10+-blue.svg)](https://python.org) [![React](https://img.shields.io/badge/React-18-61dafb.svg)](https://reactjs.org) [![FastAPI](https://img.shields.io/badge/FastAPI-0.100+-009688.svg)](https://fastapi.tiangolo.com) [English](./README_EN.md) | [繁體中文](./README_TW.md) | **简体中文** --- ### 🚀 在线体验 我们已部署线上体验版本,欢迎试用! 🔗 **体验地址:[http://223.6.255.214/](http://223.6.255.214/) 【中国大陆】** 🔗 **体验地址:[http://47.77.231.44/](http://47.77.231.44/) 【海外】** 📮 需要内测邀请码?请联系作者获取!
--- ## ✨ 2.0 新增功能 🆕 **📄 支持上传参考文档** - 项目报告、数据分析、会议纪要等,AI会自动提取要点辅助生成 🆕 **📊 支持插入图表素材** - 上传Excel表格或截图,AI直接嵌入对应页面 🆕 **💬 素材描述功能** - 为每个素材添加说明,AI理解更精准 --- ## 🔄 2025年1月30日更新 🗜️ **图片压缩优化** - 生成的PPT图片自动压缩为JPEG格式(质量85%),文件体积减少60%以上,前端加载更快 --- ## 🔄 2025年1月29日更新 🎉 **生成完成提示** - PPT生成完成后弹出提示窗口,快速下载ZIP/PDF或进入微调模式 ⏳ **上传加载优化** - 素材上传过程中显示加载动画,上传完成前禁止关闭弹窗,避免误操作 🔄 **重新生成动画** - 单页重新生成时显示遮罩动画,清晰展示当前状态 📁 **文件格式验证** - 母版和Logo上传增加格式校验,仅支持PNG/JPG/WebP/GIF,不支持EMF/SVG等矢量格式 💡 **格式提示优化** - 上传区域显示明确的格式说明,避免用户上传不支持的文件类型 --- ## 🔄 2025年1月28日更新 📝 **每页主旨设置** - 选择具体页数后,可为每一页单独设置主旨/主题,AI生成更精准的大纲 ✏️ **大纲预览编辑** - 大纲生成后右侧预览区可直接编辑标题和内容,点击「应用编辑」同步到大纲 🎯 **图片微调模式** - 图片生成后点击页面进入微调模式,仅修改指定部分,其他元素保持不变 🔢 **页码显示控制** - 高级设置→布局设置中可选择隐藏页码 --- ## ✨ 项目亮点 🚀 **一键生成** - 输入主题或想法,AI 自动生成完整 PPT,从大纲到设计一气呵成 🎙️ **语音转写** - 支持上传会议录音,AI 自动转写并整理成结构化演示文稿 📄 **文档理解** - 上传PDF/Word/PPT/Excel文档,AI自动提取关键信息 📊 **素材嵌入** - 为指定页面上传图表、截图、数据表格,AI直接嵌入PPT 🎨 **多种风格** - 内置商务简约、酷炫技术等预设风格,支持完全自定义 🖼️ **AI 绘图** - 基于 Google Gemini 图像生成模型,为每页生成专业级配图 📝 **实时协作** - 交互式修改大纲和设计,AI 理解你的反馈并即时调整 🎯 **精准控制** - 自定义配色、字体、页数、Logo,满足企业 VI 需求 --- ## 📸 效果展示 ### 功能介绍动画
### 登录界面
SlideBot AI 登录界面 *简洁优雅的登录界面,支持邀请码验证*
### 工作台
SlideBot AI 工作台 *功能丰富的工作台:选择风格、调整内容丰富度、上传录音转写*
### 生成过程
PPT生成过程 *实时显示生成进度,支持逐页预览和修改*
### 设计成果展示
| 研究流程图 | 背景分析 | |:---:|:---:| | | | | 架构图 | 业务分析 | |:---:|:---:| | | | *AI 生成的专业级 PPT 页面,支持多种风格和布局*
### 📊 表格数据嵌入效果
表格数据嵌入效果 *支持上传Excel表格数据,AI自动理解并嵌入PPT页面,生成专业的数据展示*
--- ## 🎬 完整工作流程
### 从想法到 PPT 的完整旅程
``` ┌─────────────────────────────────────────────────────────────────┐ │ Step 1: 📝 输入你的想法 │ │ ───────────────────────────────────────────────────────────── │ │ "帮我做一个关于2026年AI发展趋势的PPT, │ │ 面向投资人,需要数据支撑,10页左右" │ │ │ │ 💡 可上传会议录音,AI 自动转写整理 │ │ 📄 可上传参考文档(PDF/Word/PPT/Excel),AI 自动提取要点 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Step 2: 🎨 选择风格 & 配置参数 │ │ ───────────────────────────────────────────────────────────── │ │ • 风格预设:商务简约 / 酷炫技术 / 自定义 │ │ • 内容丰富度:内容丰富 / 简约风格 / 跟随整体 │ │ • 页数控制:自动判断 或 指定 1-20 页 │ │ • 高级设置:配色方案 / 字体 / Logo / 母版 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Step 3: 📋 AI 生成大纲(可修改) │ │ ───────────────────────────────────────────────────────────── │ │ 第1页:封面 - 2026 AI趋势展望 │ │ 第2页:市场规模 - 万亿级赛道 │ │ 第3页:技术突破 - 多模态与Agent │ │ ... │ │ │ │ ✏️ 不满意?告诉 AI 你的修改意见,实时调整 │ │ 📊 可为指定页面上传图表素材(图片/Excel/粘贴的表格片段),生成时自动嵌入 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Step 4: 🎯 AI 生成设计方案(可修改) │ │ ───────────────────────────────────────────────────────────── │ │ 为每一页生成详细的设计理念和视觉方案: │ │ • 页面布局结构 │ │ • 配色运用说明 │ │ • 图表/图形建议 │ │ │ │ ✏️ 不满意?继续对话调整,直到满意为止 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Step 5: 🖼️ AI 逐页生成 PPT 图片 │ │ ───────────────────────────────────────────────────────────── │ │ 🎨 正在生成第 3/10 页... │ │ ████████████████░░░░░░░░░░░░ 50% │ │ │ │ 📊 上传的素材会自动嵌入对应页面 │ │ ✏️ 单页不满意?点击缩略图,输入修改意见重新生成 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────────┐ │ Step 6: 📥 下载成品 │ │ ───────────────────────────────────────────────────────────── │ │ • ZIP 打包下载(所有图片) │ │ • PDF 一键导出 │ │ • 使用 WPS【PDF转PPT】工具进一步编辑 │ └─────────────────────────────────────────────────────────────────┘ ``` --- ## 🛠️ 技术架构 ``` ┌─────────────────────────────────────────────────────────────────┐ │ Frontend │ │ React 18 + 响应式设计 + 深色/浅色主题 │ └─────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────┐ │ Backend │ │ FastAPI + Python 3.10+ + 异步架构 │ └─────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────┐ │ AI Services │ │ Google Gemini (文本生成 + 图片生成) │ │ 科大讯飞 iFlytek (语音转写) │ └─────────────────────────────────────────────────────────────────┘ ``` --- ## 🚀 快速开始 ### 环境要求 - Python 3.10+ - Node.js 18+ - Google Gemini API Key ### 安装步骤 ```bash # 1. 克隆项目 git clone https://github.com/tonyqinatcmu/SlideBot.AI.git cd SlideBot.AI # 2. 安装后端依赖 pip install -r requirements.txt # 3. 配置环境变量 cp .env.example .env # 编辑 .env 文件,填入你的 API Key # 4. 安装前端依赖并构建 cd frontend npm install npm run build cd .. # 5. 启动服务 python server.py ``` 访问 `http://localhost:8001` 开始使用! 默认邀请码为"VISITOR", 可以修改invite_codes.json文件。 --- ## ⚙️ 配置说明 在 `.env` 文件中配置以下参数: ```env # Google Gemini API (必需) GEMINI_API_KEY=your_gemini_api_key # 科大讯飞语音转写 (可选,用于录音转写功能) IFLYTEK_APP_ID=your_iflytek_app_id IFLYTEK_API_SECRET=your_iflytek_api_secret # 服务配置 PORT=8001 HOST=0.0.0.0 ``` ### API 密钥获取 | 服务 | 用途 | 获取地址 | |------|------|----------| | Google Gemini | 文本/图像生成 | [Google AI Studio](https://makersuite.google.com/app/apikey) | | 科大讯飞 | 语音转写(可选) | [讯飞开放平台](https://www.xfyun.cn/) | --- ## 📁 项目结构 ``` slidebot/ ├── server.py # 后端主程序(FastAPI路由) ├── requirements.txt # Python 依赖 ├── .env.example # 环境变量示例 ├── .gitignore # Git 忽略配置 ├── LICENSE # MIT 开源协议 ├── invite_codes.json # 邀请码配置 │ ├── modules/ # 后端模块(模块化架构) │ ├── __init__.py # 模块导出 │ ├── config.py # 配置常量(API密钥、路径等) │ ├── prompts.py # AI提示词模板 │ ├── models.py # Pydantic数据模型 │ ├── asr.py # 科大讯飞语音转写 │ ├── invite_codes.py # 邀请码管理 │ ├── session.py # 会话状态管理 │ ├── gemini_api.py # Gemini API调用封装 │ └── visit_counter.py # 访问计数器 │ ├── frontend/ # React 前端 │ ├── src/ │ │ ├── App.js # 主组件(包含所有UI逻辑) │ │ └── index.js # 入口文件 │ ├── public/ │ │ ├── index.html │ │ └── wps-tip.png # WPS 提示图 │ └── package.json │ ├── docs/ # 文档资源 │ └── images/ # README 截图 │ ├── outputs/ # 生成的图片输出(自动创建) ├── references/ # 上传的参考文件(自动创建) ├── audio/ # 录音文件(自动创建) └── records/ # 使用记录(自动创建) ``` --- ## 🎨 功能特性 ### 核心功能 | 功能 | 描述 | |------|------| | 🤖 智能大纲 | 根据输入自动生成结构化PPT大纲,支持实时修改 | | 🎨 风格设计 | AI为每页生成详细的设计方案和视觉理念 | | 🖼️ 图片生成 | 使用Gemini生成专业级配图,支持2K/4K分辨率 | | 📝 实时迭代 | 对话式交互,随时调整内容和设计 | | 📥 多格式导出 | 支持ZIP打包和PDF一键导出 | ### 高级功能 | 功能 | 描述 | |------|------| | 🎙️ 录音转写 | 上传会议录音,AI自动转写并整理成PPT | | 🏢 母版支持 | 上传企业母版图片,保持VI一致性 | | 🎯 自定义配色 | 灵活配置主色、辅助色、强调色 | | 📝 自定义字体 | 中英文字体分别设置 | | 📊 内容丰富度 | 数据丰富/简约风格自由切换 | | 🌙 深色模式 | 支持深色/浅色主题切换 | ### 🚧 开发计划 (TODO) - [x] 智能大纲生成与迭代修改 - [x] AI 设计风格生成 - [x] Gemini 图片逐页生成 - [x] 录音转写整理成 PPT - [x] 自定义配色、字体、Logo - [x] ZIP / PDF 多格式导出 - [x] 素材上传 - 支持用户上传 PDF、Word、PPT、Excel、图片等素材,AI 自动提取整理 - [ ] **演讲稿生成** - 除 PPT 外,为用户生成配套的演讲稿 / 讲稿 - [ ] **风格持久化** - 保存用户的个性化风格偏好,下次使用自动加载 --- ## 🔧 开发指南 ### 本地开发 ```bash # 后端开发(热重载) uvicorn server:app --reload --port 8001 # 前端开发 cd frontend npm start ``` ### 生产部署 推荐使用以下方式部署: ```bash # 生产环境部署 uvicorn server:app --host 0.0.0.0 --port 8001 # 或使用 Docker(可自行编写 Dockerfile) ``` 配合 Nginx 反向代理和 Systemd 服务管理可实现更稳定的生产环境部署。 --- ## 🤝 贡献指南 我们欢迎所有形式的贡献! 1. Fork 本项目 2. 创建你的特性分支 (`git checkout -b feature/AmazingFeature`) 3. 提交你的更改 (`git commit -m 'Add some AmazingFeature'`) 4. 推送到分支 (`git push origin feature/AmazingFeature`) 5. 开启一个 Pull Request --- ## 📄 开源协议 本项目采用 [MIT License](LICENSE) 开源协议。 --- ### 开源项目 - [Google Gemini](https://deepmind.google/technologies/gemini/) - 多模态AI模型 - [科大讯飞](https://www.xfyun.cn/) - 语音转写服务 - [FastAPI](https://fastapi.tiangolo.com/) - 现代高性能Python Web框架 - [React](https://reactjs.org/) - 用户界面构建库 --- ## ⭐ Star History 如果这个项目对你有帮助,请给我们一个 Star ⭐ [![Star History Chart](https://api.star-history.com/svg?repos=tonyqinatcmu/SlideBot.AI&type=Date)](https://star-history.com/#tonyqinatcmu/SlideBot.AI&Date) --- ## 👨‍💻 联系作者
### Shenlin (Tony) Qin | 📧 邮箱 | 💬 微信 | 🔗 LinkedIn | |:---:|:---:|:---:| | [tonyqinatcmu@gmail.com](mailto:tonyqinatcmu@gmail.com) | | [![LinkedIn](https://img.shields.io/badge/LinkedIn-Shenlin%20Qin-blue?style=flat&logo=linkedin)](https://hk.linkedin.com/in/shenlinqin) | --- ### Jie Tang | 📧 邮箱 | 💬 微信 | 🔗 LinkedIn | |:---:|:---:|:---:| | [jobtj@sina.com](mailto:jobtj@sina.com) | | [![LinkedIn](https://img.shields.io/badge/LinkedIn-Jie%20Tang-blue?style=flat&logo=linkedin)](https://www.linkedin.com/in/jay-tang-a0773352) | --- 欢迎交流探讨 AI、产品设计、创业等话题!
---
**用 ❤️ 打造 | Made with ❤️** [报告Bug](https://github.com/tonyqinatcmu/SlideBot.AI/issues) · [功能建议](https://github.com/tonyqinatcmu/SlideBot.AI/issues) · [讨论区](https://github.com/tonyqinatcmu/SlideBot.AI/discussions)