# ai-drama-generator **Repository Path**: lankii/ai-drama-generator ## Basic Information - **Project Name**: ai-drama-generator - **Description**: AI短剧自动生成项目--未完成 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2026-04-07 - **Last Updated**: 2026-04-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AI短剧生成系统 一个完整的AI短剧自动生成Pipeline,使用 **Google AI** 全家桶:**Gemini (文本) + 大香蕉 (图像) + Veo 3.1 (视频)** ## 🚀 快速开始 ### 1. 安装依赖 ```bash pip install google-generativeai requests ``` ### 2. 配置API密钥 复制 `.env.example` 为 `.env` 并填入你的 API 密钥: ```bash cp .env.example .env ``` 编辑 `.env`: ```bash # Google AI API (用于 Gemini 文本生成和 Veo 视频生成) GOOGLE_API_KEY=your_google_api_key_here # 大香蕉 API (用于图像生成) BANANA_API_KEY=your_banana_api_key_here ``` ### 3. 运行Pipeline ```bash # 基本使用 python run.py -i "一个失忆的人在陌生城市醒来" # 指定项目名称和时长 python run.py -i "一个失忆的人在陌生城市醒来" -p my_drama -d 60 # 使用图片描述作为输入 python run.py -i "一张海边日落的照片,有一个孤独的身影" -t image ``` ### 4. Python代码调用 ```python from src.pipeline.main import AIDramaPipeline # 创建Pipeline pipeline = AIDramaPipeline( project_name="my_drama", api_key="your_google_api_key" ) # 执行完整流程 result = pipeline.run( user_input="一个失忆的人在陌生城市醒来", input_type="text", duration=90 ) # 访问结果 print(result["story_outline"]["story_title"]) ``` ## 🤖 AI模型配置 | 功能 | 模型 | 说明 | |------|------|------| | **文本生成** | Gemini 2.0 Flash | 故事大纲、分镜脚本等所有文本内容 | | **图像生成** | 大香蕉 (Banana) | 分镜图像、场景图 | | **视频生成** | Veo 3.1 | AI视频片段生成 | ## 📁 项目结构 ``` ai-drama-generator/ ├── run.py # 快速启动脚本 ├── .env.example # 环境变量模板 ├── README.md # 本文件 ├── prompts/ # 10个Prompt模板 │ ├── 01_input_analysis.md │ ├── 02_story_outline.md │ ├── 03_scene_design.md │ ├── 04_character_design.md │ ├── 05_storyboard.md │ ├── 06_scene_description.md │ ├── 07_image_prompt.md │ ├── 08_video_prompt.md │ ├── 09_voiceover_script.md │ └── 10_music_sfx.md ├── src/ │ ├── config/settings.py # 配置 │ ├── clients/google_ai.py # Google AI 客户端 │ ├── pipeline/main.py # 主Pipeline │ └── utils/helpers.py # 工具函数 └── output/ # 输出目录 ``` ## 🔄 10步流程 ``` 用户输入(文字/图片) │ ▼ ┌─────────────────────────────────┐ │ 步骤1: 输入解析与创意扩展 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤2: 故事大纲生成 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤3: 场景设计与素材库 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤4: 角色设计 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤5: 分镜脚本生成 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤6: 场景与画面详细描述 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤7: 图像生成Prompt │ → Gemini → 大香蕉生成 └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤8: 视频生成Prompt │ → Gemini → Veo 3.1生成 └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤9: 配音脚本生成 │ → Gemini └─────────────────────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ 步骤10: 音乐与音效设计 │ → Gemini └─────────────────────────────────┘ │ ▼ 最终输出:完整素材包 ``` ## ⚙️ 环境变量 | 变量 | 说明 | 必需 | |------|------|------| | `GOOGLE_API_KEY` | Google AI API密钥 | ✅ | | `BANANA_API_KEY` | 大香蕉 API密钥 | ⚠️ (图像生成需要) | | `GEMINI_MODEL` | Gemini模型名称 | 默认 `gemini-2.0-flash` | ## 🔧 生成素材 ### 生成图像 ```python # 使用大香蕉生成图像 result = pipeline.generate_image( shot_number="1-1", prompt="Extreme close-up of an Asian man's eye...", width=768, height=1344 ) print(result["images"]) ``` ### 生成视频 ```python # 使用 Veo 3.1 生成视频 result = pipeline.generate_video( shot_number="1-1", prompt="亚洲男性眼睛极特写,眼睛缓缓睁开...", duration=5, image_url="https://..." # 可选:图生视频 ) print(result["video_url"]) ``` ## 📝 License MIT License