1 Star 1 Fork 1

MightZ / 基于爬虫技术的商城商品上新降价实时推送

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.en.md 1.97 KB
一键复制 编辑 原始数据 按行查看 历史
  1. 基于爬虫技术的商城商品上新降价实时推送

    介绍

    基于爬虫技术的商城商品上新降价实时推送,Python编写,爬取对象均为实时交易的国际二手商品商城,特点为一旦商品卖出则该商品不可再被检索到,且商品的上架和价格变化十分频繁且具有随机性,对数据处理速度有一定要求;目前已用Docker部署在服务器,可实时进行消息推送,具备一定的实用性;

    软件架构

    程序主要分为爬取,数据库交互,数据比较,邮件发送,总调度五个部分;

    其中

    爬取部分负责爬取商场商品信息,主要包括商品名称,价格,图片,库存等,采用BeautifulSoup库进行爬取;

    数据库交互部分负责与远程MySQL数据库进行交互,使用连接池技术,每次爬取全部商品信息后才进行一次与数据库的交互,降低数据库使用频率,提高程序运行速度;

    数据比较部分负责将对数据进行比较,若与数据库已存信息存在重复,则比较其价格是否发生变化,若新爬取数据未在数据库中,则新插入该行数据,若数据库已存信息未在新爬取数据中发现,则说明商品已售出,将该行数据从数据库中删除;

    邮件发送部分负责将新上架和降价商品的信息以图文超链接的形式通过邮件发送到客户端,用户可通过点击商品信息和图片直接访问商品页面;

    总调度部分主要负责对检索关键字以及检索的深度进行调度;

    使用截图

    1. 代码运行

      img

    2. 数据库

      img

    3. 邮箱推送

      img

    特技

    1. Docker;
    2. BeautifulSoup;
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/lovetoeatmeat/real-time-market-crawler.git
git@gitee.com:lovetoeatmeat/real-time-market-crawler.git
lovetoeatmeat
real-time-market-crawler
基于爬虫技术的商城商品上新降价实时推送
master

搜索帮助

344bd9b3 5694891 D2dac590 5694891