# graph-calculate **Repository Path**: wdym/graph-calculate ## Basic Information - **Project Name**: graph-calculate - **Description**: graph-calculate,图计算算法。交付代码 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-04-26 - **Last Updated**: 2022-03-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 图计算项目 ### 需求 #### 科研学术网络 * DBLP数据集科研学术网 * 下载链接;https://dblp.uni-trier.de/xml/ * 详细说明:https://dblp.uni-trier.de/xml/docu/dblpxml.pdf * 提取Article节点数据 __任务__ 先删除或修改数据集中错误部分(同名歧义等),按年份划分时间片,提取数据集中关键年份的数据,然后分别构建作者合作关系网络结构 ~~观察机构在时间维度上的演化:先按照年份划分时间片,对每个年份的数据构建模型~~ 针对性的选几个代表性的年份,跟踪这几个时间片上的演化 1. 这几个年份的论文关键词,选取top10 结果文件在`./data/dblp/top10.csv` 2. 再选取比较早的年份的top1关键词,追踪后面年份这个关键词相关的论文数量的变化(可以看出这个方向研究热度的变化) 最热门词汇是`system` ![](images/systemCount.jpg) 3. 选取一个关键词,分析针对这个关键词发表论文数量较多的作者选出其中的top5,需要统计发文数量,多分析几个年份的 选取的关键词是`complex network` ![](images/complexNetworkCount.jpg) 4. 选取其中一个领域,找到核心人物(重要节点发现算法-局部中心法等,或其他的算法,网上也有代码实现过的)跟踪该领域后面年份的核心人物的变化 结果在`./data/dblp/corePeople.csv`, 中心性计算用的是`eigenvector centrality` 5. bigboss 焦李成, 数据在`data/dblp/bigboss2articles.json` 图如下: ![](./images/焦李成.jpg) #### 诗人网络 唐代诗人生平数据集 __任务__ 将数据集按照初唐盛唐中唐晚唐的时间划分 分析所有的出现过的地方, 对地方进行可视化, 会有如下形式: ![](./images/poem/all_place.jpg) > 其实已经很像现代的中国了。 唐朝的版图很大 1. 分析不同时间片活跃的诗人 * 时间片 * 初唐 618—713 * 盛唐 713—766 * 中唐 766—836 * 晚唐 836—907 * 不同时期的活跃诗人 * 导出csv到`result/poem` * 可视化柱状图, 保存至`images/poems` * ![](./images/poem/盛唐诗人活跃图.jpg) * 分析了不同时期较为活跃的诗人的迁徙情况, 并且做了可视化 * ![](./images/poem/activePoetImmigrationMap.jpg) * 2. 分析诗人李白的社交关系,同一时间去过同一地点,两人就有可能相识。 * 李白的社交网络会生成一个`json`文件, 文件在`result/poem/libai_social.json` 3. 诗人杜甫的迁徙图,什么时间去了什么地点。 * 迁徙图在`images/poem/dufu.jpg` ![](./images/poem/dufu.jpg)