# DataMiningProject
**Repository Path**: oceanrivers/data-mining-project
## Basic Information
- **Project Name**: DataMiningProject
- **Description**: 本项目选择对全球自行车十年销售数据进行数据挖掘相关工作
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2024-11-25
- **Last Updated**: 2025-03-28
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 这是一个史诗级的巨著
# version1.0
时间:2024年11月25日23:13:55
内容:完成了数据预处理和认识数据部分的内容,其中数据预处理可能在后续还会根据需要进行修改,
频繁模式的挖掘完成了部分,关于频繁模式的挖掘找到了一个非常好用的包,就是“https://rasbt.github.io/mlxtend/” ,比我之前用过的包要好用hhh
# version2.0
时间:2024年11月26日23:05:49
内容:完成了频繁模式挖掘部分的内容,分类部分做了一点,本来是使用scikit-learn包里的东西来做的,但是scikit-learn的决策树要求属性必须是数值属性,所以对于标称属性必须要先进行编码,有点难搞(非常无语)
# version3.0
时间:2024年11月28日21:11:30
内容:完成了分类和聚类的功能,使用scikit-learn做分类基本都要求标称数据必须编码,然后聚类部分在绘图的时候需要先进行降维操作(大于2维的情况下)