3 Star 18 Fork 5

htu/bigdata2024

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

综合实训课程3-作业2 作业内容:

  1. 模拟生成约5万条如下数据: 该数据显示的是约200个用户在某个城市不同地区某个超市多次的消费金额, 以下是数据示意,不一定要与示意数据一致,可自行模拟生成,符合需求即可:

    用户编号 用户姓名 年龄 注册时间 消费区域 消费金额
    a1 吕胜 40 2019-8-21 红旗区 123

    原始数据格式:

    用户编号 用户姓名 出生日期 注册时间 消费区域 消费金额
    15311484568 李昊哲 1983-11-22 2018-07-07 东辽县 7
  2. 将模拟生成的数据导入hive数据仓库

  3. 分析:(1)消费金额最多的前10位用户信息 (2)消费区域最多的前3个地区

  4. 提交实现报告名称:综合实训课程3-作业2.doc 将模拟生成数据的核心代码、导入hive及数据分析的SQL代码 写入实验报告,并进行简要说明。

  5. 实验报告内容题目:综合实训课程3-数据模拟及分析

马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/htu-soft/bigdata2024.git
git@gitee.com:htu-soft/bigdata2024.git
htu-soft
bigdata2024
bigdata2024
master

搜索帮助