RuiJi.Scraper
TypeScript
forked from 朱平齐/RuiJi.Scraper
TypeScript

RuiJi Scraper是可视化的网络数据提取浏览器插件,支持目前大部分主流浏览器。 例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器、猎豹浏览器、百度浏览器、360极速浏览器,以及火狐浏览器、微软最新的Edge浏览器。

最近更新: 接近4年前

spider-flow
Java
forked from ssssssss-team/spider-flow
关闭
Java

新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。

最近更新: 接近4年前

YayCrawler
Java
forked from 代码神童/YayCrawler
Java

分布式爬虫系统,简单使用,高级配置。可扩展,减轻开发量,能docker化,适应各种急切需求核心框架:WebMagic, Spring Boot ,MongoDB, ActiveMQ ,Spring + Quartz,Spring Jpa , Druid,Redis, Ehcache ,SLF4...

最近更新: 接近4年前

网页版文本相似度检测系统
Java

用SimHash算法制作的文本相似度检测系统,项目涉及中文分词、TF-IDF权重计算、SimHash相似度计算。

最近更新: 5年多前

webmagic
Java
forked from 黄亿华/webmagic
Java

webmagic 是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。

最近更新: 6年多前
成就
0
Star
2.2K
Fork
成员(1)
muxiaoshan

搜索帮助