代码拉取完成,页面将自动刷新
唐诗分析程序主要是通过抓取互联网上的唐诗,然后进行数据的清洗,存储,数据分析,输出报告。
随着Java的发展,提供了流式处理(Stream)数据的能力,以及数据挖掘也是近年来比较热门的技术职业发展方向。通过初步学习,研究简单的数据采集,清洗,存储和分析,了解整个数据挖掘的基本流程。
数据采集主要来自:古诗文网
ansj
)htmlunit
)HTML/CSS/JavaScript
, echarts
,jQuery
)mvn package -Dmaven.test.skip=true
输出可执行程序target/tangshi-analyze-1.0.0.jar
application.properties
java -jar tangshi-analyze-1.0.0.jar
java -jar tangshi-analyze-1.0.0.jar crawler-run
git clone https://gitee.com/secondriver/tangshi-analyze.git
cd tangshi-analyze
mysql -u 数据库用户名 -p
source tangshi\tangshi.sql
src\main\resources\application.properties
spring.datasource.username=数据库用户名
spring.datasource.password=数据库密码
src\main\java\com.bittech.tangshianalyze.TangshiAnalyzeApplication
程序入口src\main\java\com.bittech.tangshianalyze.crawler
爬虫部分src\main\java\com.bittech.tangshianalyze.analyze
数据分析src\main\java\com.bittech.tangshianalyze.web
Web接口此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
1. 开源生态
2. 协作、人、软件
3. 评估模型