数据集概述
本数据集为两个计算机科学(CS)相关Twitter账号(@EuCitSci、@SciStarter)的ego网络分析结果数据,已完成匿名化处理。包含节点列表和边列表文件,集成了社交网络分析(SNA)相关指标,支持用R或Gephi等工具进行分析与可视化,用于复现相关研究成果。
文件详解
- edges.json(JSON格式)
- 字段映射:包含source(源节点)、target(目标节点)、wherefrom(关系来源,如friendslist/followerlist)、account(所属ego账号),记录账号间的关注关系,可通过account字段区分两个独立网络
- nodes.json(JSON格式)
- 字段映射:包含username(匿名化数字ID)、CS(社区成员类型)、followers_count(粉丝数)、friends_count(关注数)、favourites_count(收藏数)、listed_count(被收录数)、statuses_count(推文数)、degree(节点度数)、in_degree(入度)、out_degree(出度)、reciprocity(互惠率)、account(所属ego账号)
数据来源
Zenodo开放数据集平台
适用场景
- 社交网络结构分析:通过节点度数、入度/出度等指标研究CS领域Twitter账号的网络拓扑特征
- 社区成员行为研究:分析不同CS社区账号的粉丝数、推文数等行为指标与网络位置的关联
- 关注关系模式挖掘:基于wherefrom字段探究账号关注关系的形成来源与网络构建机制
- 研究成果复现:支持相关论文中关于Twitter ego网络分析结果的验证与复现
- 网络可视化展示:利用节点/边列表数据生成CS领域Twitter账号的网络关系图谱