4 Star 3 Fork 1

臭水沟 / hadoop

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.md 644 Bytes
一键复制 编辑 原始数据 按行查看 历史
hogan.lin 提交于 2015-11-02 17:44 . 上传这几天学习的代码

项目顺序

  • 1、hdfs
  • 2、map-reduce
  • 3、map-reduce-sort
  • 4、combiner

1、hdf

  • 使用java api 操作hdfs

2、map-reduce

  • 手机号码流量统计, 且加入了Partitioner(分区)将Mapper分发到不同的reducer处理, 结果产生多个分区文件
  • 单词个数统计

3、map-reduce-sort

  • 使用两个mapReduce进行关联统计(目前第二个mapreduce还有问题,在获取第一个mapreduce产生的hdfs文件时候会报: 数组下标越界问题)

4、combiner

  • 使用 Mapper ---> Combiner ---> Reducer 进行统计每个单词在不同的文件中各自出现的次数(倒排索引)
Java
1
https://gitee.com/cshuig/hadoop.git
git@gitee.com:cshuig/hadoop.git
cshuig
hadoop
hadoop
master

搜索帮助