# mobileData **Repository Path**: Space__X/mobileData ## Basic Information - **Project Name**: mobileData - **Description**: 信令数据分析 - **Primary Language**: Scala - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-04-03 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 说明 ## 数据源 移动2014年11月3日~2014年11月15日 工作日的信令轨迹数据 ## 目录 - /home/wx/test/preProc: 预处理后的数据(去抖动,多时段至少有1个数据) - /home/wx/test/activeData:存放用户日数据量>30条的数据目录,称之为日活跃用户 - /home/wx/test/continue: 用户多天(5天)都是活跃的 - /home/wx/twoweeks/clusterResults:存放第一次聚类结果 - onlyMove: 只有移动点的用户 - stopAll: 用户天级停留点 - /home/wx/twoweeks/clusterSecond:多天的第二次聚类结果,最少neighbors数为2 - allLSP:所有用户长期停留点 - allTSP:离群点,用户临时天级停留点 - onlyLSP:(只有长期停留点的用户数据) - onlyTSP:(只有天级别临时停留点的用户数据) - AnalysisResN2 :分析第二次聚类结果 最少neighbors为2 ## 问题 - 第二次聚类后,稳定停留点(非离群点)占比约为40%,仅仅420w用户,太少了,通过加大数据时间跨度到2周解决 - 活跃用户不连续,即今天活跃的明天可能没数据,5天内超过3天活跃的不多 - 第二次聚类时,以(用户+第一次聚类的停留点属性)为大类,停留点属性可能判断不准 - 未来的方法可能是,把多天所有停留点放在一起聚类,得到稳定的停留点,再对稳定的停留点进行属性判断而不是先判断属性后再进行第二次聚类。这样可能会好一些 - 去抖动并不彻底,依然存在抖动数据导致 第一次聚类结果中,部分用户不能得到天级停留点