# taobao_google_extension **Repository Path**: classjing/taobao_google_extension ## Basic Information - **Project Name**: taobao_google_extension - **Description**: 功过google插件获取淘宝商品数据 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-06-07 - **Last Updated**: 2026-06-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Taobao Google Extension 淘宝搜索结果数据提取 Chrome 扩展插件,支持商品数据提取、分页浏览、数据库存储。 --- ## 功能特性 - **自动抓取** — 打开插件自动提取当前淘宝搜索页的商品数据 - **商品详情** — 提取标题、价格、销量、发货地、店铺名、标签、属性、图片、链接 - **分页浏览** — 插件内直接翻页,触发页面原生分页按钮 - **数据库存储** — 商品数据保存到本地 SQLite 数据库,按商品 ID 去重 - **JSON 导出** — 一键复制提取的 JSON 数据 - **窗口自适应** — 弹出窗口默认占屏幕 80% 宽、70% 高,可自由拖拽缩放 --- ## 环境要求 | 项目 | 要求 | |------|------| | 浏览器 | Chrome / Edge(支持 Chromium 扩展) | | Python | 3.6+(仅数据库功能需要,无需安装额外依赖) | --- ## 安装插件 ### 1. 下载项目文件 将项目文件夹保存到本地任意位置,例如 `D:\my_first_extension` ### 2. 加载到 Chrome 1. 打开 Chrome,地址栏输入 `chrome://extensions/` 2. 右上角打开 **「开发者模式」** 3. 点击 **「加载已解压的扩展程序」** 4. 选择项目文件夹(如 `D:\my_first_extension`) 5. 扩展图标出现在浏览器工具栏 ✅ ### 3. 固定扩展图标(推荐) 点击 Chrome 工具栏的拼图图标 🧩,找到 **Taobao Google Extension**,点击📌固定 --- ## 使用方法 ### 提取商品数据 1. 打开淘宝搜索页:[https://s.taobao.com/](https://s.taobao.com/) 2. 输入关键词搜索商品 3. 点击浏览器工具栏的扩展图标 4. 插件窗口弹出,**自动滚动页面**加载所有商品(触发图片懒加载) 5. 数据自动展示在表格中 > ⚠️ 插件仅在淘宝搜索页(`s.taobao.com`)可用,其他页面会提示「请去淘宝搜索页面使用」 ### 分页浏览 - 点击 **「« 上一页」/「下一页 »」** 触发页面原生翻页 - 输入页码点击 **「GO」** 跳转到指定页 - 翻页后自动重新提取数据 ### 复制 JSON 点击 **「📋 复制 JSON」** 按钮,将提取的原始数据复制到剪贴板 --- ## 数据库存储功能 ### 1. 启动后端服务 打开 PowerShell,执行: ```powershell cd D:\my_first_extension python server.py ``` 看到以下输出表示服务启动成功: ``` [OK] 数据库初始化完成 [OK] 服务已启动: http://localhost:8765 [DB] 数据库文件: taobao_data.db 按 Ctrl+C 停止服务 ``` > 服务运行期间请勿关闭此窗口 ### 2. 保存数据 1. 在插件中提取商品数据后 2. 点击 **「💾 保存到数据库」** 按钮 3. 数据自动存入 SQLite 数据库 ### 数据库说明 | 项目 | 说明 | |------|------| | 数据库文件 | `D:\my_first_extension\taobao_data.db` | | 去重规则 | 按商品 ID(`item_id`)去重,重复商品会更新 | | 存储字段 | 商品ID、搜索关键词、标题、价格、价格描述、销量、发货地、店铺名、标签、属性、图片URL、商品链接、页面URL、页码、创建时间 | ### 查询已保存数据 可直接用 Python 查询: ```python import sqlite3 conn = sqlite3.connect("D:/my_first_extension/taobao_data.db") rows = conn.execute("SELECT * FROM products ORDER BY created_at DESC LIMIT 10").fetchall() for row in rows: print(row) conn.close() ``` 或访问 API: ``` http://localhost:8765/api/items # 获取最近 200 条商品 http://localhost:8765/api/stats # 获取统计信息 ``` --- ## 文件结构 ``` my_first_extension/ ├── manifest.json # 扩展配置(Manifest V3) ├── background.js # 后台脚本(创建弹出窗口) ├── content.js # 内容脚本(滚动页面 + 提取数据) ├── popup.html # 弹出窗口界面 ├── popup.js # 弹出窗口逻辑 ├── icon.png # 扩展图标 ├── server.py # Python 后端服务(SQLite) └── taobao_data.db # SQLite 数据库文件(运行后生成) ``` --- ## 常见问题 ### Q: 点击扩展图标没反应? A: 确保在淘宝搜索页(`s.taobao.com`)使用,其他页面不支持。 ### Q: 提取的数据不全/图片空白? A: 插件会自动滚动页面触发懒加载,请耐心等待滚动完成。 ### Q: 保存数据提示「无法连接数据库服务」? A: 需要先启动后端服务:`python server.py` ### Q: 端口 8765 被占用? A: 修改 `server.py` 中的 `PORT = 8765` 为其他端口,同时修改 `popup.js` 中的 `API_BASE` 和 `manifest.json` 中的 `host_permissions`。 ### Q: 如何导出数据? A: 点击「复制 JSON」复制到剪贴板,或从 SQLite 数据库直接导出。