# 数据挖掘笔记 **Repository Path**: attempt/data_mining_notes ## Basic Information - **Project Name**: 数据挖掘笔记 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-03-22 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 数据挖掘笔记 ### week 06 #### 游戏设计就业需求及特性的就业分析 本项目产出按《2019互联网新兴人才白皮书》及《数据科学教育白皮书》挖掘的关于游戏设计工作的数据,以解决游戏设计就业需求及特性的就业分析问题。 这次使用的关键词为:**游戏设计**, 薪资为:**10到15万**, 行业为:**互联网/电商**, 公司为:**中国500强**。 一共搜集了**10**页数据。 #### 数据最小可用产品 * 问题:游戏设计是否吃香?在设计领域是否还是十分紧缺人才? * 目前最低范围内薪资10-15万,属于互联网/电商行业的中国五百强企业公司所提供的职位主要集中在腾讯,阿里巴巴,网易和小米,而职位所在城市更是基本存在于一二线,可见对于500强企业来说,游戏设计依旧还是比较抢手,即便目前薪资属于最基础的一类,但依旧有不少的职位提供。 #### 挖掘Query参数 * curPage 翻页 * industries 行业细分 * compTag 公司分类 * salary 薪资 [week06数据挖掘代码](https://gitee.com/attempt/data_mining_notes/blob/master/%E7%AC%AC%E5%85%AD%E5%91%A8/week06.ipynb) ---------------------------------------- ### week09 #### 腾讯媒体研究院公众号了解媒体最新情况 数据加值宣言:本项目产出按腾讯媒体研究院公众号文章的挖掘的关于**媒体**,**互联网**,**运营**,**发展**的数据,以解决目前互联网媒体的运营发展情况的分析问题 * 公众号:腾讯媒体研究院 * 关键词分类:媒体,互联网,运营,发展 * 一共**117**页所有文章数据 #### 数据最小可用产品 * 问题:目前媒体应该怎样运营?互联网下的媒体又会有怎样的发展? * 可以了解到的是,腾讯媒体研究院的文章以**媒体**内容为主体,知道腾讯作为互联网大头之一在目前不同形式下不断创造适应时代的新媒体发展道路,同时也在寻求不一样的新闻媒体结合方式,让媒体的运营和发展达到最大的价值。 #### 挖掘微信公众号的基本信息 * title 文章标题 * create_time 创建时间 * link 文章链接 * variable 文章分类 * nickname 搜寻公众号名称 * wechat 微信号 * img 公众号图片链接 * name 公众号类型 以上对应的参数数据可以让我们清晰了解到公众号爬取出来的文章主题,创建时间和文章查看链接,更清晰的知道该公众的定位以及他所呈现的主要信息媒体内容。余下部分可以了解到在搜寻公众号过程中相关的公众号信息。 [week09数据挖掘代码](https://gitee.com/attempt/data_mining_notes/tree/master/%E7%AC%AC%E4%B9%9D%E5%91%A8)