666978_xtuhcy_1578930371
Gecco 是一款用java语言开发的轻量化的易用的网络爬虫,整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架。
8 months ago 6 issues
297689_jmxd_1578919598
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
19 days ago 2 issues
357525_zongtui_1578921330
基于hadoop思维的分布式网络爬虫。
over 3 years ago
2040377_code4everything_1578991454
用JavaFX开发基于crawler4j的图形化的网络爬虫
over 1 year ago 新增自定义 updated on Apr 17
784199_yadong.zhang_1578932767
博客猎手,基于webMagic的博客爬取工具,支持慕课、csdn、iteye、cnblogs、掘金和V2EX等各大主流博客平台。博客千万篇,版权第一条。狩猎不规范,亲人两行泪。
13 days ago v1.0.1 updated on Mar 11
一个支持集群部署的分布式 DHT 网络爬虫
3 months ago
使用JCEF(chromium内核)开发的抓取数据浏览器,可以用来制作浏览器,也可以用来制作爬虫。
over 1 year ago 1 issue
4868106_zscao_1578976050
squirrel(聚哩猫)是一款基于Java语言开发,借助webmagic框架实现的聚合科技资讯爬虫项目,享受24H科技新闻速览。
1 month ago
498783_wkgcass_1578925763
基于Jsoup的搜索引擎结果抓取.支持baidu/bing/sogou/360
over 3 years ago
自己的简易爬虫框架
over 1 year ago 0.0.5 updated on Jul 28
479915_kagura_1578925178
KCrawler-开源云爬虫 . https://github.com/KingFalse/KCrawler
1 year ago
A simple and flexible web crawler framework for java. https://github.com/xbynet/crawler
over 2 years ago
1181431_alisonyu_1578945336
一个简单高效的Java爬虫框架
over 1 year ago

Help Search