开放世界节点分类的图神经网络终身学习数据集

数据集概述

本数据集包含三个时序图数据集,用于分布偏移下的节点分类任务。包括DBLP-Easy、DBLP-Hard引文图数据集和PharmaBio合作图数据集,节点为科学出版物,边为引文或共同作者关系,任务是分类节点所属会议/期刊或类别,DBLP数据集中新类别随时间出现。

文件详解

该数据集包含三个压缩文件,每个文件对应一个子数据集,内部结构一致: - dblp-hard-citation-graph.zip:压缩文件,包含DBLP-Hard引文图数据 - adjlist.txt:图结构的邻接列表文件,每行第一个条目为源节点,其余为相邻节点 - X.npy:节点特征的NumPy序列化文件,节点ID与adjlist.txt对应 - y.npy:节点标签的NumPy序列化文件,节点ID与adjlist.txt对应 - t.npy:时间步的NumPy序列化文件,节点ID与adjlist.txt对应 - dblp-easy-citation-graph.zip:压缩文件,包含DBLP-Easy引文图数据,内部文件结构同上 - pharmabio-collab-graph.zip:压缩文件,包含PharmaBio合作图数据,内部文件结构同上

适用场景

  • 图神经网络研究:用于开发和评估终身学习框架在开放世界节点分类任务中的性能
  • 分布偏移分析:研究图数据中类别随时间变化的分布偏移问题
  • 引文网络分析:分析科学出版物的引文关系及分类规律
  • 合作网络研究:探究科研人员合作关系与期刊分类的关联
  • 时序图学习:支持时序图数据的节点分类算法开发与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 43.3 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。