# ai-drama-generator

**Repository Path**: lankii/ai-drama-generator

## Basic Information

- **Project Name**: ai-drama-generator
- **Description**: AI短剧自动生成项目--未完成
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2026-04-07
- **Last Updated**: 2026-04-07

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# AI短剧生成系统

一个完整的AI短剧自动生成Pipeline，使用 **Google AI** 全家桶：**Gemini (文本) + 大香蕉 (图像) + Veo 3.1 (视频)**

## 🚀 快速开始

### 1. 安装依赖

```bash
pip install google-generativeai requests
```

### 2. 配置API密钥

复制 `.env.example` 为 `.env` 并填入你的 API 密钥：

```bash
cp .env.example .env
```

编辑 `.env`：

```bash
# Google AI API (用于 Gemini 文本生成和 Veo 视频生成)
GOOGLE_API_KEY=your_google_api_key_here

# 大香蕉 API (用于图像生成)
BANANA_API_KEY=your_banana_api_key_here
```

### 3. 运行Pipeline

```bash
# 基本使用
python run.py -i "一个失忆的人在陌生城市醒来"

# 指定项目名称和时长
python run.py -i "一个失忆的人在陌生城市醒来" -p my_drama -d 60

# 使用图片描述作为输入
python run.py -i "一张海边日落的照片，有一个孤独的身影" -t image
```

### 4. Python代码调用

```python
from src.pipeline.main import AIDramaPipeline

# 创建Pipeline
pipeline = AIDramaPipeline(
    project_name="my_drama",
    api_key="your_google_api_key"
)

# 执行完整流程
result = pipeline.run(
    user_input="一个失忆的人在陌生城市醒来",
    input_type="text",
    duration=90
)

# 访问结果
print(result["story_outline"]["story_title"])
```

## 🤖 AI模型配置

| 功能 | 模型 | 说明 |
|------|------|------|
| **文本生成** | Gemini 2.0 Flash | 故事大纲、分镜脚本等所有文本内容 |
| **图像生成** | 大香蕉 (Banana) | 分镜图像、场景图 |
| **视频生成** | Veo 3.1 | AI视频片段生成 |

## 📁 项目结构

```
ai-drama-generator/
├── run.py                    # 快速启动脚本
├── .env.example              # 环境变量模板
├── README.md                 # 本文件
├── prompts/                  # 10个Prompt模板
│   ├── 01_input_analysis.md
│   ├── 02_story_outline.md
│   ├── 03_scene_design.md
│   ├── 04_character_design.md
│   ├── 05_storyboard.md
│   ├── 06_scene_description.md
│   ├── 07_image_prompt.md
│   ├── 08_video_prompt.md
│   ├── 09_voiceover_script.md
│   └── 10_music_sfx.md
├── src/
│   ├── config/settings.py        # 配置
│   ├── clients/google_ai.py      # Google AI 客户端
│   ├── pipeline/main.py          # 主Pipeline
│   └── utils/helpers.py          # 工具函数
└── output/                       # 输出目录
```

## 🔄 10步流程

```
用户输入（文字/图片）
        │
        ▼
┌─────────────────────────────────┐
│ 步骤1: 输入解析与创意扩展        │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤2: 故事大纲生成              │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤3: 场景设计与素材库          │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤4: 角色设计                  │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤5: 分镜脚本生成              │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤6: 场景与画面详细描述        │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤7: 图像生成Prompt            │  → Gemini → 大香蕉生成
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤8: 视频生成Prompt            │  → Gemini → Veo 3.1生成
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤9: 配音脚本生成              │  → Gemini
└─────────────────────────────────┘
        │
        ▼
┌─────────────────────────────────┐
│ 步骤10: 音乐与音效设计           │  → Gemini
└─────────────────────────────────┘
        │
        ▼
    最终输出：完整素材包
```

## ⚙️ 环境变量

| 变量 | 说明 | 必需 |
|------|------|------|
| `GOOGLE_API_KEY` | Google AI API密钥 | ✅ |
| `BANANA_API_KEY` | 大香蕉 API密钥 | ⚠️ (图像生成需要) |
| `GEMINI_MODEL` | Gemini模型名称 | 默认 `gemini-2.0-flash` |

## 🔧 生成素材

### 生成图像

```python
# 使用大香蕉生成图像
result = pipeline.generate_image(
    shot_number="1-1",
    prompt="Extreme close-up of an Asian man's eye...",
    width=768,
    height=1344
)
print(result["images"])
```

### 生成视频

```python
# 使用 Veo 3.1 生成视频
result = pipeline.generate_video(
    shot_number="1-1",
    prompt="亚洲男性眼睛极特写，眼睛缓缓睁开...",
    duration=5,
    image_url="https://..."  # 可选：图生视频
)
print(result["video_url"])
```

## 📝 License

MIT License