# sparksql的电影分析项目 **Repository Path**: gong-yu-git/sparksql_moviestat ## Basic Information - **Project Name**: sparksql的电影分析项目 - **Description**: 使用sparksql技术,读取hdfs文件到dataframe,然后跑sql语句进行电影分析,结果写出到mysql (hadoop集群、spark on yarn、pyspark编程) - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2022-02-11 - **Last Updated**: 2023-06-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # sparksql的电影分析项目 #### 介绍 使用sparksql技术,读取hdfs文件到dataframe,然后跑sql语句进行电影分析,结果写出到mysql (hadoop集群、spark on yarn、pyspark编程) #### 软件架构 3台机器,搭建hadoop集群 master上安装mysql和spark,采用spark on yarn模式 1)DemoMainApp是主类 2)metrics是3个需求脚本 3)util存放的公用类 代码参考于:https://blog.csdn.net/xianyu120/article/details/122283996