# final_webmining_cnki **Repository Path**: lian_dan_qi/final_webmining_cnki ## Basic Information - **Project Name**: final_webmining_cnki - **Description**: 数据挖掘期末项目——对cnki中主题为“可持续发展”“数字”“绿色营销”的内容进行了抓取 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-07-04 - **Last Updated**: 2025-05-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # final_webmining_cnki ### 文档描述 [源文件](https://gitee.com/lian_dan_qi/final_webmining_cnki/blob/master/webmining_cnki_final_DM.ipynb) #### 抓取步骤&注意事项 :exclamation: 1. 进入知网后需要检查确认 **账户状态** 1. 进行专业检索前应点击学术期刊 1. 输入检索内容后应勾选期刊名称 1. 检索成功后将文章按照 **被引次数** 降序排列 1. 截图验证码前需不断调整以获取最佳截图位置 1. 下载pdf文件前download文件夹需要存在一个文件[(如图——1.txt)](https://gitee.com/lian_dan_qi/final_webmining_cnki/blob/master/refworks/pdf%E5%B1%95%E7%A4%BA.jpg)以防报错 ### 数据目标: :earth_africa: 在中国知网对主题为“可持续发展”“数字”“绿色营销”的内容进行了抓取,下载了refworks文件并使用VOSviewer对其关键词出现 **频率达到4** 的进行了 **可视化呈现** ,使我们能对绿色可持续发展和数字之间的关系有更深入的理解 ### 数据结果描述: 意料之内绿色营销和可持续发展是频率最高的,接着分别是绿色产品绿色管理,绿色消费 但有时候会有一些意外收获,例如我们可以发现在“高校图书馆”和“绿色营销”方面竟然也有关联并且有些研究 - 数据清洗前 ![数据清洗前](refworks/清洗前.png) - 数据清洗后 ![数据清洗后](refworks/清洗后.png) - pdf下载展示 ![pdf](refworks/pdf展示.jpg)