代码拉取完成,页面将自动刷新
基于(anyproxy)中间人注入方式,抓取微信公众号文章列表,阅读数,点赞数,评论列表
#快速启动
npm install
cd node_modules/anyproxy/bin/
node anyproxu-ca
Book-Air:wechat_sprider chen$ node index.js
[AnyProxy Log][2019-09-06 23:58:21]: throttle :10000kb/s
[2019-09-06 23:58:21 <lvl:4> ]<Parser handler> Load [article_list] success
[2019-09-06 23:58:21 <lvl:4> ]<Mysql connection Success>
[AnyProxy Log][2019-09-06 23:58:21]: Http proxy started on port 8001
[AnyProxy Log][2019-09-06 23:58:21]: web interface started on port 8002
[AnyProxy Log][2019-09-06 23:58:21]: Active rule is: 抓取微信公众号历史文章
proxyServer is ready
手机浏览器访问:http://ip:8002/ 点击RootCA > download。然后进行证书安装
如果是IOS>=10.3系统,设置->通用->关于本机->证书信任设置 中把AnyProxy证书的开关打开
连接成功的话,在文章列表页面会出现 <请翻页,以便数据采集>字样。手动往下滑动,即会自动将采集到的数据保存至mysql
仅是业余时间编写的demo,可能存在很多问题,仅供参考
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。