# webRobot **Repository Path**: supermanlcq/webrobot ## Basic Information - **Project Name**: webRobot - **Description**: 简单爬虫,使用mybatis和webmagic,主要爬取百度贴吧 - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2017-04-12 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 简单的爬虫,主要爬取百度贴吧 1. 系统组件 主要使用webMagic实现爬取,mybatis进行持久化。 2. 系统配置config.json { "servicepackage":"com.simplerobot.service", //Service包路径 "daoPackageName":"com.simplerobot.dao", //dao包路径 "spider":[ { "name":"test", //爬虫名称 "class":"com.simplerobot.robot.tieba.BaiduTieBaSpider", //爬虫类 "url":"http://tieba.baidu.com/f?kw=h网&fr=ala0&tpl=5" //入口url },.............. ] } 可以配置多个爬虫