# 小红书爬虫 **Repository Path**: darling3/little-red-book-crawler ## Basic Information - **Project Name**: 小红书爬虫 - **Description**: 该爬虫基于selenium实现,实现对小红书笔记摘要、笔记详情和用户信息的爬取,并保存为csv文件 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 9 - **Created**: 2023-12-08 - **Last Updated**: 2023-12-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: 爬虫爬爬爬 ## README # 小红书爬虫 该爬虫基于selenium实现,实现对小红书笔记摘要、笔记详情和用户信息的爬取,并保存为csv文件 ## 环境准备 - 请检查selenium和pandas是否安装 ```shell pip install selunium pip install pandas ``` - 创建edge浏览器的快捷方式,并拷贝到该目录下。Edge浏览器一般在这个目录(C:\Program Files (x86)\Microsoft\Edge\Application)下可找到,创建msedge.ext的快捷方式即可 - 下载浏览器对应版本的selunium驱动,具体方法见[使用 WebDriver 自动执行 Microsoft Edge - Microsoft Edge Development | Microsoft Learn](https://learn.microsoft.com/zh-cn/microsoft-edge/webdriver-chromium/?tabs=c-sharp) ,将驱动的压缩文件解压到该目录下 - 创建一个名为user_data的文件夹 执行完以上操作,你的文件目录应当包含一个edgedriver_win64的文件夹、一个名为user_data的文件夹、一个名为msedge.exe的快捷方式,以及clone下来的其他文件 ## 启动 - 点击run_edge.cmd,浏览器应该会启动。你可以手动关闭Edge浏览器的一些弹窗,但请不要手动访问其他网页。 - 在当前目录下执行 ```shell python xhs.py ``` - 根据提示操作即可,完成后会在目录下生成三个csv文件,可用excel打开。