# DataMiningProject **Repository Path**: oceanrivers/data-mining-project ## Basic Information - **Project Name**: DataMiningProject - **Description**: 本项目选择对全球自行车十年销售数据进行数据挖掘相关工作 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-11-25 - **Last Updated**: 2025-03-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 这是一个史诗级的巨著 # version1.0 时间:2024年11月25日23:13:55
内容:完成了数据预处理和认识数据部分的内容,其中数据预处理可能在后续还会根据需要进行修改, 频繁模式的挖掘完成了部分,关于频繁模式的挖掘找到了一个非常好用的包,就是“https://rasbt.github.io/mlxtend/” ,比我之前用过的包要好用hhh # version2.0 时间:2024年11月26日23:05:49
内容:完成了频繁模式挖掘部分的内容,分类部分做了一点,本来是使用scikit-learn包里的东西来做的,但是scikit-learn的决策树要求属性必须是数值属性,所以对于标称属性必须要先进行编码,有点难搞(非常无语) # version3.0 时间:2024年11月28日21:11:30
内容:完成了分类和聚类的功能,使用scikit-learn做分类基本都要求标称数据必须编码,然后聚类部分在绘图的时候需要先进行降维操作(大于2维的情况下)