OGBN-MAG异构学术网络数据集

OGBN-MAG异构学术网络数据集 数据来源:互联网公开数据
标签:异构网络,学术图谱,多分类,特征工程,关系建模,机器学习基准

数据概述:
OGBN-MAG数据集是Open Graph Benchmark(OGB)中的一个异构学术网络数据集,基于Microsoft Academic Graph(MAG)的子集构建。该数据集包含四种类型的节点:论文(736,389个节点)、作者(1,134,649个节点)、机构(8,740个节点)和研究领域(59,965个节点),以及四种类型的有向边:作者与机构的隶属关系、作者与论文的创作关系、论文与论文的引用关系、论文与研究领域的主题关系。每篇论文节点关联一个128维的word2vec特征向量,其他类型的节点不具有输入特征。

数据用途概述:
该数据集适用于多种学术网络分析场景,包括但不限于:
1. 学术网络结构分析,研究论文、作者、机构和领域的关联模式;
2. 特征工程与关系建模,探索异构网络中的特征提取与关系表示方法;
3. 多分类任务研究,预测论文所属的会议或期刊 venue,助力学术信息补全与推荐;
4. 机器学习模型评估,作为基准数据集用于图神经网络等模型的性能测试与优化;
5. 学术影响力分析,研究论文、作者及机构的学术影响力评估与排名。

该数据集为研究异构网络的复杂结构及其在实际问题中的应用提供了丰富的数据支持,适用于学术研究、工业应用及算法开发等场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 873.6 MiB
最后更新 2025年6月4日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。