# vx_autocrawler-pi **Repository Path**: soulnull/vx_autocrawler-pi ## Basic Information - **Project Name**: vx_autocrawler-pi - **Description**: linux(树莓派)终端实时轮播各平台热搜榜,支持知乎,微博,头条,百度。 - **Primary Language**: Java - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-06-24 - **Last Updated**: 2021-04-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # vx_autocrawler-pi #### 介绍 基于微信小程序抓取爬虫项目后台修改,只需要实现一个接口即可实现一个抓取。无需管理调度,简单强大。 #### 部署教程 [树莓派爬虫多平台热搜榜轮播展示](https://app.sanii.cn/?p=260) #### 效果图 https://img-1251747095.file.myqcloud.com/img/20200624210130.jpg ![](https://images.gitee.com/uploads/images/2020/0624/220705_7e2eda72_1393640.jpeg) #### 微信小程序 https://gitee.com/SAnBlog/vx_autocrawler #### 安装教程 1. jdk8 2. LomBok #### 功能 抓取调度部分使用爬虫框架,基于springboot Earth:https://gitee.com/SAnBlog/Earth 已实现抓取热搜榜如下 百度,知乎,头条,微博,SAnBlog,妹子图 #### 示例 ##### 可视化大屏界面 ![](https://img-1251747095.file.myqcloud.com/img/20200710214131.png) 一个妹子图抓取的完整代码,如果想爬整站请参考Earth:https://gitee.com/SAnBlog/Earth ``` /** * @Author: shouliang.wang * @Date: 2019-02-21 21:09:25 * @Description: https://www.mzitu.com/xinggan/ */ public class Mzitu2Processor implements IProcessor { @Override public void process(Response response) { Document document = response.getDocument(); /** * 图片地址提取规则 */ List resultList = Lists.newArrayList(); document.getElementsByTag("img").forEach(element -> { String img = element.attr("data-original"); if (StringUtils.isNotEmpty(img)) { String alt = element.attr("alt"); ByteBean byteBean = ByteBean.builder().name(UUID.randomUUID().toString().replace("-", "")).url(img).alias(alt).build(); resultList.add(byteBean); } }); response.getResultField().getFields().put(FieldEnum.BYTE, PipelineExt.builder().byteBeans(resultList).build()); } @Override public String name() { return "mzitu"; } } ```