# comic_crawler

**Repository Path**: miinori/comic_crawler

## Basic Information

- **Project Name**: comic_crawler
- **Description**: 一个简单的Python漫画网站爬虫
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 2
- **Forks**: 0
- **Created**: 2020-03-07
- **Last Updated**: 2022-05-31

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Python 漫画网站爬虫
## 尊重版权，只供爱好者研究使用，禁止商业用途，保留追究法律责任的权利
## 简介
作为二刺猿，漫画是不能断的，一直在追的漫画使用正版软件观看，
也花费不了多少钱，但是对于那些章节多的，
使用正版软件观看需要花费一大笔费用，所以找漫画就需要去其他免费的网站上看了，
原来[动漫之家](http://manhua.dmzj.com/)是有许多漫画和轻小说的，但慢慢的都被正版搬空了，
这里推荐一个漫画网站：[新新漫画](https://www.177mh.net/)，
更新得挺快的，爬就完事儿了，开始整活
## 运行环境
* 开发语言：python3
* 系统：Windows/Linux/MacOS
## 使用说明
### 1.下载脚本
```
git clone https://github.com/MemoryDewey/comic_crawler.git
```
运行上述命令，将本项目下载到当前目录，如果下载成功当前目录会出现一个名为"comic_crawler"的文件夹；
### 2.安装依赖
```
$ pip3 install
```
### 3.程序设置
前往[新新漫画](https://www.177mh.net/)，查询自己想要搜索的漫画，
查看漫画对应的URL，这里拿[租借女友](https://www.177mh.net/colist_240268.html)举例，
URL中有colist_240268，拿到colist后面的数字240268

打开comic.py文件，在**main**代码中，修改**cid**对应的值为上面拿到的数字
```
if __name__ == '__main__':
    # 网站漫画ID，修改这里
    cid = "240268"
    chapters = None
    get_chapter('https://www.177mh.net/colist_%s.html' % cid)
    f = open('./details.json', 'r', encoding='UTF-8')
    chapters = json.load(f)
    for chapter in chapters:
        get_comic(chapter, cid)
    print('done')
```

开始运行，在目录下会有一个downloads文件夹，里面便是下载好的漫画
> 如需更改漫画文件名，则打开rename.py
> 更改old_name为已下载的漫画名，new_name为自定义的漫画名，
> 运行即可

## 说明
> 如果对您有帮助，您可以点右上角 "Star" 支持一下 谢谢！ ^_^