2 Star 7 Fork 1

sent/python基于Selenium框架爬取美团酒店数据

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

python基于Selenium框架爬取美团酒店数据

介绍

软件架构

开发环境:python3.7 web框架:flask 爬虫裤架:selenium 浏览器:chrome请安装版本 75.0.3770.8(正式版本) (64 位)

安装教程

使用pip安装模块即可 1.pip install selenium //安装爬虫框架

2.pip install flask //安装web框架

3.并安装Google浏览器,chrome请安装版本 75.0.3770.8(正式版本) (64 位)

4.将geckodriver.exe放入python的安装路径

5.命令行下打开Google浏览器,输入此命令,然后登陆https://i.meituan.com,让浏览器保存cookie 命令:chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"

6.运行server.py文件,请将getgetromid.py和MAIN放在同一文件夹

使用说明

1.接口地址:http://ip地址:9900/getHotel

2.必要参数:citynane:城市拼音 hotelname:查询的酒店名 startTime:入住时间 格式:2017-5-1 entTime:退房时间 格式:2017-5-2

3.接口实例:http://ip:9900/getHotel?citynane=nanjing&hotelname=朗昇希尔顿酒店&startTime=2019-5-20&endTime=2019-5-21

4.接口返回json的列表格式:[{},{},{}]

5.每个列表是一个字典类型,参数有: 参数 含义 类型 roomname 房间名 str breakfast 是否含早 str Price 价格 int Originalprice 原价 int hasroom 是否有房 str

6.返回类型示例 [{"roomname": "希尔顿双床房(1 双床) 代理", "breakfast": "不含早不可取消", "Price": 737, "Originalprice": 847, "hasroom": "预订"}, {"roomname": "希尔顿客房双床房 代理", "breakfast": "不含早不可取消", "Price": 773, "Originalprice": 883, "hasroom": "预订"}, {"roomname": "希尔顿客房双床房 代理", "breakfast": "不含早不可取消", "Price": 800, "Originalprice": 910, "hasroom": "预订"}]

码云特技

  1. 使用 Readme_XXX.md 来支持不同的语言,例如 Readme_en.md, Readme_zh.md
  2. 码云官方博客 blog.gitee.com
  3. 你可以 https://gitee.com/explore 这个地址来了解码云上的优秀开源项目
  4. GVP 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目
  5. 码云官方提供的使用手册 https://gitee.com/help
  6. 码云封面人物是一档用来展示码云会员风采的栏目 https://gitee.com/gitee-stars/

空文件

简介

取消

发行版

暂无发行版

贡献者

全部

语言

近期动态

不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/the_sent/selenium.git
git@gitee.com:the_sent/selenium.git
the_sent
selenium
python基于Selenium框架爬取美团酒店数据
master

搜索帮助