# data_mining **Repository Path**: sealedgodjn/data_mining ## Basic Information - **Project Name**: data_mining - **Description**: 数据挖掘课程 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-05-18 - **Last Updated**: 2022-11-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 数据挖掘实验和大作业 ## 实验 实验一 k-means算法 实验二 k-mediods算法VSk-means算法 实验三 决策树ID3算法和KNN算法 实验4 朴素贝叶斯算法 实验5 遗传算法 实验六 句子相似度计算 实验七 DocHITS LexRank ## 大作业 多文档自动摘要 已完成 ## 更新记录 2021.4.10 删除所有.csv文件 2022.3.18 开始系统性的学习matplotlib和python基础(还包括javascript) ## 项目结构 ├─DataVisualization // 数据可视化相关的研究 │ └─折线图 ├─data_classification // 本科大四——数据挖掘——大作业(自动提取文章的摘要) │ ├─BigHomework │ │ ├─improve_one │ │ │ └─__pycache__ │ │ ├─improve_two │ │ │ └─bbc │ │ │ └─politics │ │ └─model │ ├─data │ ├─dataset // 数据集 │ └─scripts │ ├─Bayes │ ├─ex7 │ │ └─bbc │ │ └─politics │ ├─Genetic │ ├─test │ └─TF-ISF │ └─punkt │ └─PY3 ├─Graduation_Essay // 毕业设计(情绪识别)相关的代码 │ ├─test │ │ ├─degree_dict │ │ ├─emotion_dict │ │ ├─result_data │ │ ├─stop_words │ │ ├─test_data │ │ └─Using_cnki_judge_sentiment.assets │ └─test1 │ ├─result_data │ │ └─第一次测试结果总结.assets │ └─test_data ├─leetcode // 使用python刷题,只有3道题(主要是用Java刷题) ├─lexrank-matser // lexrank源代码 │ ├─data │ │ └─bbc_politics │ ├─lexrank │ │ ├─algorithms │ │ ├─assets │ │ │ └─stopwords_raw │ │ ├─mappings │ │ ├─tools │ │ └─utils │ ├─requirements │ └─tests │ ├─test_algorithms │ └─test_utils ├─mathmatical_modeling // 数学建模? │ └─basic_knowledge ├─MoocTest // icourse163慕课,web自动化测试,为了自动录入分数 ├─network_safety // 本科大四——网络信息安全——DES算法 │ └─__pycache__ ├─NLP // 莫烦python的学习代码 │ ├─MRPC │ ├─visual │ │ └─results │ └─__pycache__ ├─pythonCourse // 研究生的Python课程作业 ├─StudyOfDataAnalysis // 学习数据分析,虽然只学习了3周 │ ├─week1 │ ├─week2 │ └─week3 ├─tensorflow ├─tools // 工具(例如:给图片去水印) └─venv ├─Lib │ └─site-packages // Python的包 ├─nltk_data │ └─punkt │ └─PY3 └─Scripts