# IMDb-Poster **Repository Path**: YMeng-self/IMDb-Poster ## Basic Information - **Project Name**: IMDb-Poster - **Description**: 爬取 IMDB 数据库中一万条电影数据。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-24 - **Last Updated**: 2025-07-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # IMDB 电影数据爬取项目 ## 项目概述 这是一个用于爬取 IMDB 数据库中电影数据的 Python 项目,目标是从 IMDB 获取一万条电影数据。 ## 项目结构 ``` . ├── info/ # 爬取信息目录 ├── poster/ # 海报图片存储目录 ├── black_list # 黑名单文件 ├── white_list # 白名单文件 ├── main.py # 主程序文件 ├── process_info.py # 信息处理文件 └── run.log # 运行日志文件 ``` ## 使用说明 ### 环境准备 1. 确保已安装 Python 3.x 2. 安装所需依赖: ``` pip install requests beautifulsoup4 ``` ### 运行项目 1. 克隆或下载本项目到本地 2. 在项目根目录下运行: ``` python main.py ``` ### 配置选项 - 电影爬取的情况存储在 `black_list` 和 `white_list` 文件中 - 电影海报图片将下载到 `poster/` 目录 ### 注意事项 - 请遵守 IMDB 的使用条款,不要过度频繁请求 - 项目运行日志会记录在 `run.log` 中 - 如果中断运行,可以从日志记录的位置恢复爬取 ## 贡献 欢迎提交 issue 或 pull request 来改进本项目。