基于spark大数据的音乐推荐

介绍

基于spark编写的音乐推荐大数据作业，使用scala编程，使用python的flash框架作为可视化展示。 Audioscrobbler数据集有趣地方在于仅仅记录播放的历史：“某某某播放了什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量，但是评分数据总量肯定没有播放历史记录的数据多，当大量播放历史记录放在一起的时候，比评分数据将更有价值。由这个网站公布的一个2005年的数据集合可以http://www-etud.iro.umontreal.ca/bergstrj/audioscrobbler_data.html上面下载。主要的数据集是 user_artist_data.txt 文件，里面大约包含 141000 唯一的用户和 1.6 百万唯一的artist艺术家，大约 24.2 百万用户播放记录。

软件架构

软件架构说明 hadoop为分布式 + spark +hive

安装教程

xxxx
xxxx
xxxx

使用说明

xxxx
xxxx
xxxx

参与贡献

Fork 本仓库
新建 Feat_xxx 分支
提交代码
新建 Pull Request

特技

使用 Readme_XXX.md 来支持不同的语言，例如 Readme_en.md, Readme_zh.md
Gitee 官方博客 blog.gitee.com
你可以 https://gitee.com/explore 这个地址来了解 Gitee 上的优秀开源项目
GVP 全称是 Gitee 最有价值开源项目，是综合评定出的优秀开源项目
Gitee 官方提供的使用手册 https://gitee.com/help
Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 https://gitee.com/gitee-stars/

Huang_Daxian/ 基于spark大数据的音乐推荐

基于spark大数据的音乐推荐

介绍

软件架构

安装教程

使用说明

参与贡献

特技

简介

发行版

贡献者

近期动态

Huang_Daxian/ 基于spark大数据的音乐推荐 .gitee-modal { width: 500px !important; }

基于spark大数据的音乐推荐

介绍

软件架构

安装教程

使用说明

参与贡献

特技

简介

发行版

贡献者

近期动态

搜索帮助

Huang_Daxian/ 基于spark大数据的音乐推荐