# DouYinSpider **Repository Path**: johnhoowong/DouYinSpider ## Basic Information - **Project Name**: DouYinSpider - **Description**: python爬取抖音视频合集 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-06-30 - **Last Updated**: 2023-04-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 背景 对象讨厌玩抖音,我也很少看抖音。 但在偶然机会下我在抖音搜索了对象喜欢看的樱桃小丸子粤语版,发现有合集。 但为了不污染对象的手机下载抖音,故打算爬取抖音的合集视频并保存到本地(第一版)。 但是视频大小一共有1.53G,对象觉得太大太浪费流量和内存了,希望可以在线观看。 所以改成了扫二维码来打开视频链接并保存到doc文档中(第二版)(原本打算转为短连接的,但是现在貌似需要企业才能使用)。 ## 技术选型 主要选取了以下两种方式获取视频: - request模块,qrcode模块,python-docx模块(参考RequestDemoV1.py、参考RequestDemoV2.py) - selenium模块,chrome的迅雷下载插件(参考SeleniumDemo.py,尚未完成) ## 参考链接 request: - request爬取抖音视频:[https://www.bilibili.com/video/BV1154y1V7LH?from=search&seid=540013844456082294](https://www.bilibili.com/video/BV1154y1V7LH?from=search&seid=540013844456082294) - 使用python爬取抖音视频列表信息:[https://www.jb51.net/article/165340.htm](https://www.jb51.net/article/165340.htm) docx: - python操作doc并插入图片:[https://blog.csdn.net/weixin_39775127/article/details/111023688](https://blog.csdn.net/weixin_39775127/article/details/111023688) - py3安装docx:[https://blog.csdn.net/weixin_30299539/article/details/95916002](https://blog.csdn.net/weixin_30299539/article/details/95916002) qrcode: - qrcode的使用:[https://www.cnblogs.com/nthforsth/p/12290779.html](https://www.cnblogs.com/nthforsth/p/12290779.html) selenium: - selenium库的使用:[https://blog.csdn.net/weixin_36279318/article/details/79475388](https://blog.csdn.net/weixin_36279318/article/details/79475388) - Python+Selenium基础入门及实践:[https://www.jianshu.com/p/1531e12f8852](https://www.jianshu.com/p/1531e12f8852) - selenium增加已有chrome插件:[https://blog.csdn.net/zbj18314469395/article/details/89227986](https://blog.csdn.net/zbj18314469395/article/details/89227986) - 查找chrome浏览器插件的存放位置:[https://jingyan.baidu.com/article/afd8f4dec83d2134e286e9c2.html](https://jingyan.baidu.com/article/afd8f4dec83d2134e286e9c2.html)