# 拼多多店铺运营数据收集小工具 **Repository Path**: qiliping/pdd_shop_data_crawler ## Basic Information - **Project Name**: 拼多多店铺运营数据收集小工具 - **Description**: 拼多多店铺运营数据收集小工具 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-28 - **Last Updated**: 2026-02-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 拼多多商家后台数据抓取工具 ## 功能说明 本工具用于抓取拼多多商家后台的以下数据: 1. **今日数据汇总**:包括成交金额、成交订单数、推广花费、商品访客数、商品浏览量、商品评价数等指标的今日和昨日数据 2. **待发货数据**:抓取待发货订单的订单号、商品、数量、价格、订单金额、收货地址 3. **商品访客明细数据**:抓取商品概览数据和商品明细列表数据 ## 环境要求 - Node.js 16.0+ - Chrome浏览器 ## 安装依赖 ```bash npm install ``` ## 使用方法 ### 方法一:手动启动浏览器模式(推荐) 1. 首先手动启动Chrome浏览器: ```bash "C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222 --user-data-dir="C:\Users\1\chrome_debug" --no-first-run --no-default-browser-check "https://mms.pinduoduo.com" ``` 2. 在浏览器中完成登录(扫码登录) 3. 运行脚本: ```bash npm run manual ``` ### 方法二:自动启动浏览器模式 ```bash npm start ``` 然后在弹出的浏览器中完成登录,按回车键继续。 ## 解决的问题 1. **安全验证问题**:通过手动启动浏览器并手动登录,避免自动化工具被检测 2. **页面提示"太快了"**:脚本中添加了适当的等待时间,确保页面完全加载 3. **404页面问题**:使用正确的URL,避免访问不存在的页面 4. **动态加载数据**:使用额外的睡眠时间,确保数据完全加载后再抓取 5. **字体加密问题**:尝试使用多种方法获取元素的文本内容 ## 提取的内容 ### 今日数据汇总 原始html: ```html 首页 (实时数据部分)- 包含:待付款、待打印、待发货、待收货、退款/售后

待付款

0

待打印

0

去打印

待发货

0

立即发货

待收货

13

查看金额

退款/售后

0

即将逾期发货

0

待处理工单

0

去处理

售后过期预警

0

首页 (实时数据部分)- 包含:成交金额、成交金额昨日、成交订单数、成交订单数昨日、推广花费、推广花费昨日、商品访客数、商品访客数昨日、商品浏览数、商品浏览数昨日、商品评价数、商品评价数昨日
实时数据更新时间: 2026-02-28 19:25:30进入数据中心
成交金额
58.70趋势
昨日 0.00 
成交订单数
2
昨日 0 
推广花费
30.60
昨日 0.00 
商品访客数
22
昨日 46 
商品浏览量
32
昨日 55 
商品评价数
2
昨日 0 
``` ### 待发货数据 ### 商品访客明细数据 - 商品概览数据 原始html ```html
商品访客数

28

昨日46

商品浏览量

38

昨日55

昨日收藏用户数

--

较前1日--

被访问商品数

2

昨日3

成交金额

58.7

昨日0.0

成交订单数

2

昨日0

成交买家数

2

昨日0

成交转化率

7.14%

昨日0.00%

``` - 商品明细列表数据 原始html ```html
雷士照明LED光源灯芯正品保障客厅卧室餐厅书房吸顶灯LED灯板替换
ID:754380133868

昨日 
以¥13.4~97.33报名38大促销

昨日 
.
昨日 .
昨日
昨日
昨日
.%(低)
昨日 .%
昨日
雷士led灯芯吸顶磁吸节能灯板改装光源模组圆形三色模组家用环形
ID:774317814352
昨日
连降2日
以¥56.03~137.61报名品牌好价提升流量
昨日 
.
昨日 .
昨日
昨日
昨日
.%(低)
昨日 .%
昨日
``` ## 输出格式 数据将以JSON格式保存到当前目录的txt文件中,文件名格式为:`pdd_data_年月日_时分秒.txt` ## 注意事项 1. 请确保网络连接稳定 2. 登录后请不要关闭浏览器,直到脚本运行完成 3. 如果遇到登录问题,请尝试清除浏览器缓存后重新登录 4. 脚本运行过程中,请不要操作浏览器 5. 商品访客明细数据可能会因为字体加密而显示为乱码,这是拼多多的反爬虫措施 ## 常见问题 ### 问题:无法连接到浏览器 解决方案:确保Chrome浏览器已启动,且调试端口正确(默认为9222) ### 问题:数据抓取失败 解决方案:检查网络连接,确保页面已完全加载,尝试增加等待时间 ### 问题:浏览器提示安全风险 解决方案:使用手动启动浏览器模式,手动完成登录验证 ### 问题:商品访客明细数据显示为乱码 解决方案:这是拼多多的字体加密反爬虫措施,目前无法完全解决