RuiJi Scraper是可视化的网络数据提取浏览器插件,支持目前大部分主流浏览器。 例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器、猎豹浏览器、百度浏览器、360极速浏览器,以及火狐浏览器、微软最新的Edge浏览器。
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
分布式爬虫系统,简单使用,高级配置。可扩展,减轻开发量,能docker化,适应各种急切需求核心框架:WebMagic, Spring Boot ,MongoDB, ActiveMQ ,Spring + Quartz,Spring Jpa , Druid,Redis, Ehcache ,SLF4J、Log4j2, Bootstrap + Jquery 等,不详细列举了
用SimHash算法制作的文本相似度检测系统,项目涉及中文分词、TF-IDF权重计算、SimHash相似度计算。
RuiJi Scraper是可视化的网络数据提取浏览器插件,支持目前大部分主流浏览器。 例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器、猎豹浏览器、百度浏览器、360极速浏览器,以及火狐浏览器、微软最新的Edge浏览器。
最近更新: 接近4年前新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
最近更新: 接近4年前分布式爬虫系统,简单使用,高级配置。可扩展,减轻开发量,能docker化,适应各种急切需求核心框架:WebMagic, Spring Boot ,MongoDB, ActiveMQ ,Spring + Quartz,Spring Jpa , Druid,Redis, Ehcache ,SLF4...
最近更新: 接近4年前