# TrafficPredictProject **Repository Path**: shuai7boy/TrafficPredictProject ## Basic Information - **Project Name**: TrafficPredictProject - **Description**: TrafficPredictProject是一个道路拥堵情况分析预测项目。 - **Primary Language**: Scala - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2020-05-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 一、项目简介 TrafficPredictProject是一个**道路拥堵情况分析预测**项目。 它利用**Kafka**提供数据,**Redis**存储结果,然后用**逻辑回归**进行模型训练,最后根据训练的模型预测道路未来是否拥堵。 ## 二、项目结构 ``` ├─.idea │ └─codeStyles ├─data └─src └─main └─scala └─vip └─shuai7boy ├─trafficStreaming ├─train └─util ``` ## 三、数据源 **文本文件每行的数据源格式如下:** ``` '310999003001', '3109990030010220140820141230292','00000000','','2014-08-20 14:09:35','0',255,'SN', 0.00,'4','','310999','310999003001','02','','','2','','','2014-08-20 14:12:30','2014-08-20 14:16:13',0,0,'2014-08-21 18:50:05','','',' ' ``` **存储介质:** 文本文件,Kafka,Redis,HDFS。 ## 四、数据转换流程 1、通过从文本文件读取数据源,加载到Kafka主题 2、利用SparkStreaming从Kafka读取数据,将数据映射为:卡口号,(一分钟内汽车的速度和,车辆数) ,然后存入Redis。 3、从Redis取数据用于逻辑回归(LBFGS用于梯度下降)训练,训练出最近5个小时内,每三秒进行一次分类的模型。最后将模型存入HDFS,并把HDFS路径存入Redis。 4、从Redis读取路径,根据路径去HDFS找到模型文件,读取模型文件进行道路预测。