3 Star 0 Fork 0

sql2event / 新浪网的分类导航_人人网登陆_爬取当当图书网站

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

新浪网的分类导航_人人网登陆_爬取当当图书网站

项目介绍

1).使用Scrapy爬虫框架爬取新浪网的分类导航信息: 网址:http://news.sina.com.cn/guide/ 2 ). 使用scrapy模拟完成人人网登陆的登陆操作: 如URL地址:http://www.renren.com/ 3). 爬取当当图书网站中所有关于python关键字的图片信息。 参考URL:http://search.dangdang.com/?key=python&act=input 要求:将图书图片下载存储指定的目录中,而图书信息写入到数据库中。

软件架构

软件架构说明

安装教程

  1. xxxx
  2. xxxx
  3. xxxx

使用说明

  1. xxxx
  2. xxxx
  3. xxxx

参与贡献

  1. Fork 本项目
  2. 新建 Feat_xxx 分支
  3. 提交代码
  4. 新建 Pull Request

码云特技

  1. 使用 Readme_XXX.md 来支持不同的语言,例如 Readme_en.md, Readme_zh.md
  2. 码云官方博客 blog.gitee.com
  3. 你可以 https://gitee.com/explore 这个地址来了解码云上的优秀开源项目
  4. GVP 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目
  5. 码云官方提供的使用手册 http://git.mydoc.io/
  6. 码云封面人物是一档用来展示码云会员风采的栏目 https://gitee.com/gitee-stars/

空文件

简介

1).使用Scrapy爬虫框架爬取新浪网的分类导航信息: 网址:http://news.sina.com.cn/guide/ 2 ). 使用scrapy模拟完成人人网登陆的登陆操作: 如URL地址:http://www.renren.com/ 3). 爬取当当图书网站中所有关于python关键字的图片信息。 参考URL:http://search.dangdang.com/?key=python&act=input 要求:将图书图片下载存储指定的目录中,而图书信息写入到数据库中。 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/Lukyeuser/sina_renren_dangdang.git
git@gitee.com:Lukyeuser/sina_renren_dangdang.git
Lukyeuser
sina_renren_dangdang
新浪网的分类导航_人人网登陆_爬取当当图书网站
master

搜索帮助