社交网络Git仓库贡献者关系及标签数据集SocialNetworkGitRepositoryContributorsRelationshipandLabelsDataset-nichamp

社交网络Git仓库贡献者关系及标签数据集SocialNetworkGitRepositoryContributorsRelationshipandLabelsDataset-nichamp

数据来源:互联网公开数据

标签:社交网络, 图数据, 贡献者关系, 标签分类, Git仓库, 机器学习, 节点分类, 数据挖掘

数据概述: 该数据集包含来自Git仓库的贡献者关系数据,记录了贡献者之间的交互行为以及对应的标签信息。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态快照数据集。 地理范围:数据来源于Git仓库,贡献者可能来自全球各地。 数据维度: musae_git_edges.csv: 包含贡献者之间的连接关系,包括id_1和id_2两个字段,表示贡献者之间的交互。 musae_git_target.csv: 包含贡献者的标签信息,包括id(贡献者ID)和ml_target(标签),用于节点分类任务。 数据格式:数据以CSV和JSON格式提供,方便数据分析和处理。 来源信息:数据来源于Git仓库,经过处理后形成结构化数据集,便于进行社交网络分析。 该数据集适合用于社交网络分析、图神经网络、节点分类等研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于社交网络分析、图机器学习、节点分类等领域的学术研究,如贡献者行为模式分析、社区发现等。 行业应用:可以为社交网络平台、代码托管平台提供数据支持,用于用户关系分析、推荐系统构建等。 决策支持:支持开源项目的贡献者管理、社区建设和影响力评估。 教育和培训:作为图数据分析、机器学习课程的实训材料,帮助学生理解社交网络数据结构和分析方法。 此数据集特别适合用于探索贡献者之间的协作关系和标签信息,从而实现贡献者分类、行为预测等目标。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.28 MiB
最后更新 2025年5月1日
创建于 2025年5月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。