1 Star 0 Fork 0

YancyJiang / AutoStep

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

AutoStep

介绍

开源一键刷步,基于搜罗运动增强版 (http://bs.yanwan.store//run4/)

注意事项

接口设计或调用时会涉及到防爬虫等一系列问题,这里用到了。我就查询了网络来记录一下

1.通过User-Agent来控制访问 【实现难度:★】

无论是浏览器还是爬虫程序,在向服务器发起网络请求的时候,都会发过去一个头文件:headers,比如知乎的requests headers,这里面的大多数的字段都是浏览器向服务表明身份用的对于爬虫程序来说,最需要注意的字段就是:User-Agent很多网站都会建立user-agent白名单,只有属于正常范围的user-agent才能够正常访问。

解决方法:

可以自己设置一下user-agent,或者更好的是,可以从一系列的user-agent里随机挑出一个符合标准的使用。图片

2.IP限制 【实现难度:★】

如果一个固定的ip在短暂的时间内,快速大量的访问一个网站,后台管理员可以编写IP限制,不让该IP继续访问。 简单的说,就是通过ip代理,从不同的ip进行访问,这样就不会被封掉ip了。

解决方法:

可是ip代理的获取本身就是一个很麻烦的事情,网上有免费和付费的,但是质量都层次不齐。如果是企业里需要的话,可以通过自己购买集群云服务来自建代理池。

3.SESSION访问限制 【实现难度:★★★】

后台统计登录用户的操作,比如短时间的点击事件,请求数据事件,与正常值比对,用于区分用户是否处理异常状态,如果是,则限制登录用户操作权限。 缺点:需要增加数据埋点功能,阈值设置不好,容易造成误操作。

解决方法:

注册多个账号、模拟正常操作。

4.Spider Trap 【实现难度:★★★】

5.验证码 【实现难度:★★】

6.通过robots.txt来限制爬虫 【实现难度:★】

7.数据动态加载 【实现难度:★】

8.数据加密-使用加密算法 【实现难度:★★★】

9.数据加密-使用字体文件映射 【实现难度:★★★★】

10.非可视区域遮挡 【实现难度:★】


软件架构

安装教程

使用说明

参与贡献

特技

空文件

简介

免费部署静态页面 开源一键刷步,基于搜罗运动增强版 (http://bs.yanwan.store//run4/) 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
HTML
1
https://gitee.com/yancyjiang/autostep.git
git@gitee.com:yancyjiang/autostep.git
yancyjiang
autostep
AutoStep
master

搜索帮助