117_l-weiwei
强力 Java 爬虫,列表分页、详细页分页、ajax、微内核高扩展、配置灵活
over 1 year ago
471_flashsword20
webmagic 是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。
almost 2 years ago
117_l-weiwei
二代蜘蛛侠,此版本完全重新开发,比上一代更加强大(性能,易用,架构,分布式,简洁,成熟)
12 months ago
666978_xtuhcy
Gecco 是一款用java语言开发的轻量化的易用的网络爬虫,整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架。
6 months ago
429922_mail_osc
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
12 months ago
分布式爬虫系统,简单使用,高级配置。可扩展,减轻开发量,能docker化,适应各种急切需求核心框架:WebMagic, Spring Boot ,MongoDB, ActiveMQ ,Spring + Quartz,Spring Jpa , Druid,Redis, Ehcache ,SLF4J、Log4j2, Bootstrap + Jquery 等,不详细列举了
10 months ago
297689_jmxd
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
1 day ago
49322435918264
专门用来解决爬虫采集相关网站数据时模拟自动登录,验证码自动识别的问题;欢迎加入一起开发完善。
1 day ago
357525_zongtui
基于hadoop思维的分布式网络爬虫。
over 3 years ago
zhihu-crawler是一个基于Java的爬虫实战项目,主要功能是抓取知乎用户的基本资料。
9 months ago
378604_xuxueli0323
一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性;
1 year ago
A java crawler for infomation collection.
over 1 year ago
204037726835871
用JavaFX开发基于crawler4j的图形化的网络爬虫
1 year ago
454392_virjar
适合抓取封堵的爬虫框架
9 months ago
21346_smiledog
一个基于Spring+SpringMVC+Mybatis+webmagic+extjs开发的段子图片抓取平台
4 years ago

Help Search