# nutcher **Repository Path**: chehongwei/nutcher ## Basic Information - **Project Name**: nutcher - **Description**: No description available - **Primary Language**: Unknown - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-01-19 - **Last Updated**: 2022-01-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # nutcher nutcher是中文的nutch文档,包含nutch的配置和源码解析,在github持续更新。 本教程由[DataHref](http://datahref.com/)提供,未经允许,禁止转载。 目录: + [Nutch教程——导入Nutch工程,执行完整爬取](http://datahref.com/topics/1624) + [Nutch流程控制源码详解(bin/crawl中文注释版)](http://datahref.com/topics/1616) + [URLNormalizer源码详解(Nutch的URL正规化机制)](http://datahref.com/topics/1625) + [Nutch 的正则表达式配置 (regex-urlfilter.txt)](http://datahref.com/topics/1626) + [在 windows 上配置 hbase](http://datahref.com/topics/1628) + [Nutch的定位](http://datahref.com/topics/1627)