# B站追番列表爬虫与展示系统 **Repository Path**: islandwell/bzzfxt ## Basic Information - **Project Name**: B站追番列表爬虫与展示系统 - **Description**: [X] 实现Python爬虫获取B站追番数据 [X] 解析和处理爬取的番剧数据 [X] 设计HTML5页面结构和布局 [X] 实现番剧卡片和网格展示系统 [X] 添加分类筛选和搜索功能 [X] 优化页面视觉效果和动画 [X] 完成响应式布局适配不同设备 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-09-04 - **Last Updated**: 2025-09-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # B站追番列表爬虫与展示系统 这是一个用Python开发的工具,可以爬取B站用户的追番列表,并生成美观的HTML5页面进行展示,还支持导出为PDF或图片格式。 ## 功能特点 - **数据爬取**:自动获取B站用户的追番列表,包括"追番中"和"已看完"两种状态 - **数据处理**:解析和整理爬取的番剧数据,提取标题、封面图、评分、进度等信息 - **HTML5页面生成**:创建美观的响应式网页展示追番列表 - **分类筛选**:支持按状态(全部/追番中/已看完)筛选番剧 - **搜索功能**:支持按标题搜索番剧 - **排序功能**:支持按标题排序 - **导出功能**:支持将追番列表导出为PDF或图片格式 - **响应式设计**:适配不同设备(电脑、平板、手机) ## 系统要求 - Python 3.6+ - 依赖包: - requests - beautifulsoup4 - weasyprint (用于PDF导出) - pillow (用于图片导出) ## 安装与使用 1. 克隆或下载本项目到本地 2. 安装依赖包: ``` pip install requests beautifulsoup4 weasyprint pillow ``` 3. 运行主程序: ``` python main.py ``` 4. 按照提示操作: - 输入B站Cookie(需要先在浏览器登录B站) - 等待爬取数据完成 - 选择是否在浏览器中打开生成的页面 - 选择是否导出为PDF或图片 ## 文件说明 - `main.py`:主程序,整合爬虫和HTML生成功能 - `bilibili_bangumi_crawler.py`:B站追番列表爬虫 - `generate_html.py`:HTML页面生成器 - `export_utils.py`:导出功能模块 - `test_cookie.py`:Cookie测试工具,用于诊断Cookie有效性 - `install_dependencies.py`:依赖安装工具 - `bangumi_data.json`:爬取的番剧数据(运行后生成) - `bangumi_page/`:生成的HTML页面及相关资源(运行后生成) - `bangumi_exports/`:导出的PDF和图片文件(运行后生成) ## 获取Cookie的方法 ### 自动获取(推荐) 运行程序时会自动打开浏览器,您只需要: 1. 在浏览器中登录您的B站账号 2. 按F12打开开发者工具,切换到Network标签 3. 刷新页面,在请求中找到任意一个B站的请求 4. 查看请求头中的Cookie值,复制完整内容 ### 手动获取 1. 访问 https://www.bilibili.com 并登录 2. 按F12打开开发者工具,切换到Network标签 3. 刷新页面,在请求中找到任意一个B站的请求 4. 查看请求头中的Cookie值,复制完整内容 ### Cookie测试 如果遇到问题,可以使用测试工具: ```bash python test_cookie.py ``` 来测试Cookie的有效性 ## 注意事项 - 本工具仅用于个人学习和使用,请勿用于商业用途 - 爬取数据时请遵守B站的使用条款和规定 - 导出功能需要安装额外的依赖包,程序会自动尝试安装 ## 更新日志 - v1.2:添加Cookie测试工具,修复API参数验证问题 - v1.1:添加导出功能,支持导出为PDF和图片 - v1.0:初始版本,实现基本的爬取和展示功能 ## 常见问题 ### Q: 追番列表获取失败怎么办? A: 运行 `python test_cookie.py` 测试Cookie有效性,确保Cookie正确且未过期 ### Q: API返回参数验证错误? A: 程序已修复,现在会自动添加必要的参数(用户MID和时间戳) ### Q: 导出功能不可用? A: 运行 `python install_dependencies.py` 安装所有依赖包 ## 许可证 MIT License