# JSoup+EasyExcel爬取网页数据 **Repository Path**: ayinsnote/Jsoup_EasyExcel ## Basic Information - **Project Name**: JSoup+EasyExcel爬取网页数据 - **Description**: 采用Java工具类JSoup+EasyExcel,将https://www.aquanliang.com/blog栏目下的所有文章(包括分页)的标题,发布日期,阅读数以及封面图链接,输出到一个excel文件。 - **Primary Language**: Java - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2022-08-29 - **Last Updated**: 2023-04-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 工程简介 爬取https://www.aquanliang.com/blog栏目下的所有文章(包括分页)的标题,发布日期,阅读数以及封面图,并输出到一个excel文件。 注意项: 1、在测试类中运行ExcelTest进行爬取数据,并在D:\BaiduNetdiskDownload目录下生成一个testEasyExcel.xls的Excel文档。 2、由于对网站发起大量访问请求时,可能会丢失数据,所以测试时间会比较长(对每页内容爬取完成之后,线程会休眠2000毫秒)。 3、采用的工具类为JSoup+EasyExcel,运行测试类需要导入对应的jar包。