Fetch the repository succeeded.
基于爬虫技术的商城商品上新降价实时推送,Python编写,爬取对象均为实时交易的国际二手商品商城,特点为一旦商品卖出则该商品不可再被检索到,且商品的上架和价格变化十分频繁且具有随机性,对数据处理速度有一定要求;目前已用Docker部署在服务器,可实时进行消息推送,具备一定的实用性;
程序主要分为爬取,数据库交互,数据比较,邮件发送,总调度五个部分;
其中
爬取部分负责爬取商场商品信息,主要包括商品名称,价格,图片,库存等,采用BeautifulSoup库进行爬取;
数据库交互部分负责与远程MySQL数据库进行交互,使用连接池技术,每次爬取全部商品信息后才进行一次与数据库的交互,降低数据库使用频率,提高程序运行速度;
数据比较部分负责将对数据进行比较,若与数据库已存信息存在重复,则比较其价格是否发生变化,若新爬取数据未在数据库中,则新插入该行数据,若数据库已存信息未在新爬取数据中发现,则说明商品已售出,将该行数据从数据库中删除;
邮件发送部分负责将新上架和降价商品的信息以图文超链接的形式通过邮件发送到客户端,用户可通过点击商品信息和图片直接访问商品页面;
总调度部分主要负责对检索关键字以及检索的深度进行调度;
代码运行
数据库
邮箱推送
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。