电子邮件通信网络数据集
数据来源:互联网公开数据
标签:电子邮件网络,社交网络分析,信息传播,社区结构,网络科学,Enron,欧洲研究机构,维基百科,Resistance游戏,动态网络
数据概述:
本数据集包含多个电子邮件通信网络的数据,具体如下:
-
email-EuAll:欧洲大型研究机构在2003年10月至2005年5月期间的完整匿名电子邮件通信记录,共包含3,038,531封邮件,涉及287,755个不同电子邮件地址。其中,1,258个地址来自该研究机构,34,203个地址在数据集中有发送和接收邮件的记录。
-
email-Enron:Enron公司内部约50万封电子邮件的通信网络数据。节点为电子邮件地址,若地址i向地址j发送过至少一封邮件,则网络中存在一条无向边从i到j。非Enron地址在该网络中作为信息的起点或终点。
-
wiki-Talk:维基百科用户讨论页面的通信网络数据,基于截至2008年1月的维基百科页面编辑历史。节点代表维基百科用户,有向边表示用户i至少一次编辑过用户j的讨论页面。
-
comm-f2f-Resistance:基于Resistance游戏中62场游戏的面对面互动网络数据。每场游戏参与者5-8人,时长45-60分钟。使用ICAF算法从自由形式讨论中提取动态网络,并使用DeceptionRank算法表征和检测欺骗行为。网络是加权、有向和时序的,每个节点代表一名参与者,每1/3秒记录一次参与者之间的互动行为。
数据用途概述:
该数据集适用于多种网络科学研究场景:
-
用于电子邮件通信网络的结构分析,研究社交网络中的信息传播规律。
-
支持社交网络中的社区发现和角色识别,帮助理解群体互动模式。
-
适用于欺骗行为检测,通过动态网络分析识别社交网络中的异常行为。
-
可用于网络科学教育和培训,帮助研究人员和学生理解实际网络系统的复杂性。
-
支持网络拓扑特征提取、信息扩散建模、社交影响力分析等研究工作。