数据集概述
本数据集包含七万零四百二十七对跨平台匹配的Twitter与GHTorrent用户ID,这些用户被识别为可能属于同一开源开发者。数据集仅提供用户ID信息,需结合Twitter API和GHTorrent平台获取更多用户数据,仅限用于研究目的。
文件详解
- 文件名称:
CMUSTRUDEL/need-for-tweet-data-initial.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含跨平台用户匹配数据,具体字段为Twitter用户ID与对应的GHTorrent用户ID,二者为一一对应关系,用于标识同一开源开发者的跨平台身份。
数据来源
CMUSTRUDEL/need-for-tweet-data项目Initial release
适用场景
- 开源开发者社交行为研究: 分析开发者在Twitter平台对GitHub工作的讨论内容与行为模式。
- 跨平台用户身份匹配算法验证: 用于测试和优化开源社区中跨社交平台的用户身份识别模型。
- 开发者社区生态分析: 结合Twitter与GitHub数据,研究开发者在线社交网络与开源贡献之间的关联。
- 开源项目影响力评估: 通过分析开发者在Twitter上对GitHub项目的讨论,评估项目的社会影响力和传播范围。