# webBug **Repository Path**: dkXXL/webBug ## Basic Information - **Project Name**: webBug - **Description**: a web crawler. - **Primary Language**: Haskell - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2016-04-20 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # webBug ###弱智爬虫 需要配置nextweb rule文件,前者过滤爬取网页,后者过滤内容 都是通过正则表达式过滤(抱歉不是图灵完备) ###怎么配置? > <网址>:::正则表达式1 >>>>正则表达式2>>>>..... 网址也是通过正则匹配的。 可以输入多个网址。 "default" is adapted to every website