CMUSTRUDEL_推特数据获取需求_开源开发者跨平台用户身份匹配数据_初始发布版

数据集概述

本数据集包含七万零四百二十七对跨平台匹配的Twitter与GHTorrent用户ID,这些用户被识别为可能属于同一开源开发者。数据集仅提供用户ID信息,需结合Twitter API和GHTorrent平台获取更多用户数据,仅限用于研究目的。

文件详解

  • 文件名称:CMUSTRUDEL/need-for-tweet-data-initial.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含跨平台用户匹配数据,具体字段为Twitter用户ID与对应的GHTorrent用户ID,二者为一一对应关系,用于标识同一开源开发者的跨平台身份。

数据来源

CMUSTRUDEL/need-for-tweet-data项目Initial release

适用场景

  • 开源开发者社交行为研究: 分析开发者在Twitter平台对GitHub工作的讨论内容与行为模式。
  • 跨平台用户身份匹配算法验证: 用于测试和优化开源社区中跨社交平台的用户身份识别模型。
  • 开发者社区生态分析: 结合Twitter与GitHub数据,研究开发者在线社交网络与开源贡献之间的关联。
  • 开源项目影响力评估: 通过分析开发者在Twitter上对GitHub项目的讨论,评估项目的社会影响力和传播范围。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.58 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。