# Data mining-Selenium **Repository Path**: maifengyuan/selenium ## Basic Information - **Project Name**: Data mining-Selenium - **Description**: 存放相关作业文件 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-31 - **Last Updated**: 2022-11-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Web数据挖掘 #### 期末项目 主要内容:CNKI——refwork与pdf原文 #### 项目要求: 1. ipynb可执行文件及md说明(包含数据目标和数据结果描述) 2. 爬取内容refwork+pdf原文 3. 数据分析(关键词替换)——数据可视化(VOSviewer--keywords_co-occurrence) #### 数据目标+数据结果 > query: (SU=‘计量学分析’) OR (SU=‘文献计量分析’)——精准查找 #### 爬取逻辑 1. 定义下载路径,打开模拟器 2. driver.find_element_by_xpath点击+勾选相关参数 3. 确定页面与总爬取文章 4. 定义循环函数+图片识别API 5. 翻页爬取pdf #### VOSviewer入门 ![数据可视化](/期末项目/智慧教育.png)