数据挖掘与机器学习进阶 1. 在 jupyter notebook 中,实现 KNN 算法和 Decision Trees 算法,要求有完整的注释 2. 手写数字识别
最近更新: 5年前1.使⽤pandas分别从Text、 CSV、 Excel、 Html、 MySQL、 MongoDB中加载数据 2.采购实例:分别用循环和矩阵点乘来计算采购总额,以及计算两个方式的性能 3.矩阵运算操作实例
最近更新: 5年前一、 实现监控中心基础功能 1. 设计数据库表结构 主机表 主要字段:标签 ip cpu 内存 硬盘 用户表 主要字段:用户名、密码 2. 实现登录功能 3. 登录成功后,可以添加主机 4. 点击一条主机,可以查看到主机当前CPU、内存等资源占⽤用情况 5. 点击编辑功能,可以修改主机信息,如ip、签标等 6. 项目界面参考见附件 二、 使用Docker搭建分布式爬虫
最近更新: 5年前1. 准备ubuntu16.04 虚拟机 2. 熟练掌握linux 命令,整理笔记(运行重要步骤和结果要截图) 3. 会部署django 项目,把之前django做的商城项目部署到服务器,可以成功访问 4. 了解负载均衡,rabbitmq
最近更新: 5年前使用Python编程语言编写一个网络爬虫项目,将豆瓣读书网站上的所有图书信息爬取下来,并存储到MySQL数据库中。 • 爬取信息字段要求: [ID号、书名、作者、出版社、原作名、译者、出版年、页数、定价、装帧、丛书、ISBN、评分、评论人数]
最近更新: 5年前1).使用Scrapy框架和Selenium配合爬取京东网站商品列表信息(>=50页): 网址:https://list.jd.com/list.html?cat=670,671,672 爬取字段信息由自己定制,这里不做要求。 2 ). 使用scrapy-redis分布式爬取CSDN学院平台中所有课程信息 如:https://edu.csdn.net/courses/k 爬取所有课程详情url地址 然后再通过队列url中对应的每个课程详情信息,使用分布式爬取。 如:https://edu.csdn.net/course/detail/5466 要求内容:课程标题,课时、讲师、适合人群、学习人数、价格、课程大纲。
最近更新: 5年多前本周课程主要讲解Scrapy框架的使用。具体有:Scrapy爬虫框架以及内部每个组件的使用(Selector选择器、Spider爬虫类、Downloader和Spider中间件、ItemPipeline管道类等): 1).使用Scrapy爬虫框架爬取新浪网的分类导航信息: 网址:http://news.sina.com.cn/guide/ 2 ). 使用scrapy模拟完成人人网登陆的登陆操作: 如URL地址:http://www.renren.com/ 3). 爬取当当图书网站中所有关于python关键字的图片信息。 参考URL:http://search.dangdang.com/?key=python&act=input 要求:将图书图片下载存储指定的目录中,而图书信息写入到数据库中
最近更新: 5年多前1). 分页爬取豆瓣网图书Top250信息,并分别使用三种网页信息解析库(Xpath,BeautifulSoup,PyQuery),并将信息写入文件中: 网址:https://book.douban.com/top250?start=0 2 ). 访问京东商城网址,选择多个商品放入购物车后查看自己的购物车,显示效果如下 。请使用Python爬取京东商城网址购物车中的所有商品信息: 如URL地址:https://cart.jd.com/cart.action 3). 访问百度图片网站,在搜索框中输入“街拍”并点击搜索按钮,具体效果如下,请使用python程序爬取搜索的图片,并存储到指定目录下。 具体参考URL地址:http://image.baidu.com
最近更新: 5年多前