Web爬虫 - NodeJS - Web爬虫 - 开源软件

Cherokee/neocrawler

牛咖-neocrawler nodejs 的爬虫系统。特点：支持web界面方式的摘取规则配置（css selector & regex）；包含无界面的浏览器引擎（phantomjs），支持js产生内容的抓取；用http代理路由的方式防止抓取并发量过大的情况下被对方屏蔽； nodejs none-block 异步环境下的抓取性能比较高；中央调度器负责网址的调度（同一时间片内一定数量的抓取任务中根据网站的权重来决定派发任务量；支持多种抓取实例并存，定制摘取引擎和存储方式。

NodeJS

Web爬虫

7年前

ecitlm/Node-SpliderApi

基于node+express爬虫 API接口项目,包括全国高校信息、成语诗歌、星座运势、历史的今天、音乐数据接口、图片壁纸、搞笑视频、热点新闻资讯详情接口数据

NodeJS

Web爬虫

2年前

meetqy/sitemap-nodejs

输入网站地址，自动爬取网站当中所有的链接，并生成sitemap。

NodeJS

Web爬虫

6年多前

佐天泪子亲卫队/TiebaSpider

使用NodeJs/Io.Js编写的简单的对贴吧进行遍历并存入Mysql的网络爬虫，仅供参考

NodeJS

Web爬虫

9年多前

junyiz/dature

基于 Node.js 的新浪博客备份程序

NodeJS

Web爬虫

1年多前

Cherokee/arex

nodejs article extractor

NodeJS

Web爬虫

2年多前

禾惠/node-webcrawler

网页版nodejs爬虫工具

NodeJS

Web爬虫

8年多前

温斌/easy-spider

这是个基于request和async模块的简单爬虫

NodeJS

Web爬虫

5年前

xank/disney-etl

迪士尼数据清洗服务，用于从迪士尼实时排队信息统计乐园整体情况

NodeJS

Web爬虫

6年多前

Xciyang/spiking

A lightweight web crawler.

NodeJS

Web爬虫

4年前

智能硬件	IOT/物联网/边缘计算
车载应用	智能家居
自动驾驶/无人机	机器人
5G/通讯	低代码
科研论文	量子计算
芯片开发	Web 3.0
隐私计算	云原生

按钮(Button)	文本框(EditText)	布局(Layout)	图形图像(Image)
进度条(Progress)	菜单(Menu)	弹窗(Popup)	选择器(Selector)
文本组件(TextView)	列表组件(ListView)	加载器(Loading)	提醒(Notification)
视图切换(View Transition)	滑杆(Slider)	图表(Chart)	绘图组件(Draw)
计数器(Counter)	动画(Animate)	验证码(Captcha)	多媒体(Multimedia)
条形码(Barcode)	高级UI组件	地图(Map)	OpenHarmony 游戏(Gaming)
网络(Networking)	通讯(Communication)	支付(Payment)	数据库(Database)
硬件驱动(Drivers)	OpenHarmony 教程指南	OpenHarmony工具集	OpenHarmony 应用
华为移动服务(HMS)	权限(Permissions)	工具包(Toolkit)	底层组件
手势控制(Gesture)

中英文分词	支付开发包	安全开发相关	常用工具包
Excel工具包	条形码/二维码	模板引擎	图形UI组件/框架
网络开发包	语音处理	网络工具	网络服务
数据挖掘	作业/任务调度	编程语言/脚本语言	缓存组件
Markdown工具包	搜索引擎	微服务	工作流
图表组件	权限管理	报表工具	代码生成器
IoC/AOP框架	图像处理	规则引擎	JSON工具
日志工具包	Spring Boot 扩展	验证码	算法/数学计算
Node 扩展	流程引擎/工具	动画开发	移动通信

AI-人工智能	VR/AR
机器学习/深度学习	计算机视觉/人脸识别
自然语言处理	大模型

微信开发包	微信小程序/小游戏
微信应用	微信小游戏

搜索帮助