# text-good **Repository Path**: eternal8233/text-good ## Basic Information - **Project Name**: text-good - **Description**: No description available - **Primary Language**: Python - **License**: AFL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-11-17 - **Last Updated**: 2024-01-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README <<<<<<< HEAD --- marp: true --- # text-good #### 介绍 带文本信息的GOOD划分 #### 软件架构 python good_cora.py ======= # text-good ### 介绍 带文本信息的GOOD划分 ### 生成 python good_xxx.py ### 数据集介绍 #### Cora **每个节点**都有一个对应的特征向量,这个向量通常是一个高维的稀疏向量,它表示了论文的内容信息。 **边**代表论文之间的引用关系。如果一篇论文引用了另一篇论文,那么在图中就会有一条从引用论文指向被引论文的有向边。 **节点的标签**通常代表论文的主题或分类,例如机器学习、人工智能、系统等。 #### Citeseer **每个节点**在Citeseer数据集中代表一篇学术论文,具有一个对应的特征向量,这个向量通常是高维的稀疏向量,代表了论文的内容信息。 **边**在Citeseer数据集中表示论文之间的引用关系。如果一篇论文在文献中引用了另一篇论文,图中就会出现一条从引用论文指向被引论文的有向边。 **节点的标签**在Citeseer数据集中通常代表论文的主题或分类,如数据挖掘、信息检索、语义网等。 #### ogb-Arxiv **每个节点**在ogb-Arxiv数据集中代表Arxiv上的一篇学术论文,拥有一个对应的特征向量,这个向量是高维的稀疏向量,反映了论文的摘要内容。 **边**在ogb-Arxiv数据集中代表论文之间的引用关系。图中的有向边表示一篇论文对另一篇论文的引用。 **节点的标签**在ogb-Arxiv数据集中代表论文的研究领域,如计算机视觉、机器学习、量子物理等。 #### Wikics **每个节点**在Wikics数据集中代表一个维基百科上的计算机科学领域的页面,具有一个对应的特征向量,这个向量是高维的稀疏向量,包含了页面的文本信息。 **边**在Wikics数据集中代表维基百科页面之间的链接关系。如果一个页面链接到另一个页面,图中就会有一条边连接这两个节点。 **节点的标签**在Wikics数据集中通常代表页面的主题分类,如算法、数据库、编程语言等。 #### Pubmed **每个节点**在Pubmed数据集中代表一篇医学领域的学术论文,配有一个对应的特征向量,这个向量是高维的稀疏向量,代表了论文的内容信息。 **边**在Pubmed数据集中代表论文之间的引用关系。图中的有向边表示一篇论文引用了另一篇论文。 **节点的标签**在Pubmed数据集中通常代表论文的研究领域,例如生物信息学、神经科学、疾病分类等。 #### Products **每个节点**在Products数据集中代表一个产品,每个产品有一个对应的特征向量,这个向量是高维的稀疏向量,包含了产品的描述信息。 **边**在Products数据集中代表产品之间的共现关系或者用户购买行为中的关联关系。如果一个产品经常与另一个产品一起被购买,图中就可能有一条边连接这两个产品的节点。 **节点的标签**在Products数据集中通常代表产品的类别,如电子设备、服装、家居用品等。 ### 划分方式 | Cora | Citeseer | Arxiv | wikics | Pubmed | products | |----------|----------|----------|----------|----------|----------| | degree/word/homophily | degree/word/homophily| degree/time/homophily | degree/word/homophily| degree/word/homophily | degree/word/homophily| >>>>>>> 68695b45c06c9cc79dfcc08b44f1ffe2b801df9c