Fetch the repository succeeded.
本版本为一个优化性更新,主要更新点如下:
本次更新内容如下:
1 修复测试接口中传入参数异常时不能正常工作的bug。
2 优化多任务多线程时的同步机制,能更加灵活扩展
3 优化任务状态监控机制
4 优化任务停止逻辑,停止逻辑更加合理
5 其他一些bug优化
1 解决了多任务多线程模式下引线程安全问题引起的数据异常问题
2 优化系统日志,统一系统日志格式,方便问题排查
3 优化内容页地址匹配逻辑
4 分离业务处理过程
5 优化事件监听接口
6 其他一些优化
更新点如下:
风铃虫是一款轻量级的爬虫工具,似风铃一样灵敏,如蜘蛛一般敏捷,能感知任何细小的风吹草动,轻松抓取互联网上的内容。它是一款对目标服务器相对友好的蜘蛛程序,内置了二十余种常见或不常见的浏览器标识,能够自动处理cookie和网页来源信息,轻松绕过服务器限制,智能调整请求间隔时间,动态调整请求频率,防止对目标服务器造成干扰。此外,风铃虫还是一款对普通用户十分友好的工具,它提供的大量链接提取器和内容提取器让用户可以随心所欲地快速配置,甚至于只要提供一个开始请求地址就能配置出自己爬虫程序。同时,风铃虫也开放了许多自定义接口,让高级用户能够根据需要自定义爬虫功能。最后,风铃虫还天然支持分布式和集群功能,让你突破单机环境的束缚,释放出你的爬虫能力。可以说,风铃虫几乎能抓取目前所有的网站里的绝大部分内容。