# Web_mining_week12 **Repository Path**: emy_o/web_mining_week12 ## Basic Information - **Project Name**: Web_mining_week12 - **Description**: No description available - **Primary Language**: Python - **License**: AFL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-30 - **Last Updated**: 2021-05-30 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Web_mining_week12 ### 要求 * 使用selenium进入微信公众平台 * 在微信公众平台寻找指定的公众号 * 抓取该公众号指定时间区间的文章(不低于50页数据/不低于1年的数据) * 导出文章信息(应包含标题,时间,文章url链接以及文章文本内容) #### 捉取意义 捉取中大南方学工部的文字方便了更快对公众号文字内容的整理,方便了做年度总结时应用到相应的推文进行内容补充和分析。 ### 遇到的问题 无法定位xpath [解决链接](https://blog.csdn.net/mrlevo520/article/details/51926145) ### 输出的数据 [中大南方学工部](https://gitee.com/emy_o/web_mining_week12/blob/master/%E4%B8%AD%E5%A4%A7%E5%8D%97%E6%96%B9%E5%AD%A6%E5%B7%A5%E9%83%A8%E5%85%AC%E4%BC%97%E5%8F%B7%E9%93%BE%E6%8E%A5%E5%8F%8A%E6%96%87%E7%AB%A0.xlsx)