1 Star 0 Fork 0

RACH / wechat_sprider

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

wechat_sprider

基于(anyproxy)中间人注入方式,抓取微信公众号文章列表,阅读数,点赞数,评论列表

#快速启动

1 依赖安装

npm install

2 生成anyproxy证书

  • 进入项目根目录
cd node_modules/anyproxy/bin/
node anyproxu-ca

3 启动

Book-Air:wechat_sprider chen$ node index.js 
[AnyProxy Log][2019-09-06 23:58:21]: throttle :10000kb/s
[2019-09-06 23:58:21 <lvl:4> ]<Parser handler> Load [article_list] success
[2019-09-06 23:58:21 <lvl:4> ]<Mysql connection Success>
[AnyProxy Log][2019-09-06 23:58:21]: Http proxy started on port 8001
[AnyProxy Log][2019-09-06 23:58:21]: web interface started on port 8002
[AnyProxy Log][2019-09-06 23:58:21]: Active rule is: 抓取微信公众号历史文章
proxyServer is ready

4 证书下载,安装 (手机和电脑要在同一局域网下)

手机浏览器访问:http://ip:8002/ 点击RootCA > download。然后进行证书安装

如果是IOS>=10.3系统,设置->通用->关于本机->证书信任设置 中把AnyProxy证书的开关打开

5 手机连接代理

  • ifconfig/ipconfig 查看电脑内网ip (不懂怎么看的,google去~)
  • 手机打开 设置>wifi>高级>代理设置>手动>
    • ip:电脑内网ip
    • 端口:8001

6 数据库配置

  • sql文件存放在/sql/wechat_article.sql 导入本地数据库
  • 打开配置文件 /config/config.js 找到DB_CONFIG,配置自己的数据库信息

7 打开微信,访问微信公众号,打开文章列表

连接成功的话,在文章列表页面会出现 <请翻页,以便数据采集>字样。手动往下滑动,即会自动将采集到的数据保存至mysql

仅是业余时间编写的demo,可能存在很多问题,仅供参考

空文件

简介

取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/hkingsoft_admin/wechat_sprider.git
git@gitee.com:hkingsoft_admin/wechat_sprider.git
hkingsoft_admin
wechat_sprider
wechat_sprider
master

搜索帮助

344bd9b3 5694891 D2dac590 5694891