# MRtest **Repository Path**: eliyson/mrtest ## Basic Information - **Project Name**: MRtest - **Description**: mapreduce练习 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-06-02 - **Last Updated**: 2022-06-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README //一个MR案例: //order文件:order_ID、pid、amount、price //product_id文件:pid、pname //汇总输出文件:pname、amount(同一pid的数量累加)、price(同一pid的销售额累加) //涉及1:序列化、map、reduce、driver //涉及2:小文件合并combinetextinputformat //涉及3:partition分区、combine合并 //涉及4:排序(二次排序)、join、分组 //涉及5:outputformat //涉及6:输出压缩、maptask->reducetask压缩 业务需求: - 统计同一个品牌的销售额,汇总输出 - 存在多个小文件记录的order文件,汇总输出 - 按不同的商品ID(即品牌)单独输出各自的汇总文件 - 输出的结果连接product_id文件,将pid更换为品牌名称(reduce join/map join) - 压缩输出 - 输出到MySQL数据库