电子邮件通信网络数据集

电子邮件通信网络数据集

数据来源:互联网公开数据

标签:电子邮件网络,社交网络分析,信息传播,社区结构,网络科学,Enron,欧洲研究机构,维基百科,Resistance游戏,动态网络

数据概述: 本数据集包含多个电子邮件通信网络的数据,具体如下:

  1. email-EuAll:欧洲大型研究机构在2003年10月至2005年5月期间的完整匿名电子邮件通信记录,共包含3,038,531封邮件,涉及287,755个不同电子邮件地址。其中,1,258个地址来自该研究机构,34,203个地址在数据集中有发送和接收邮件的记录。

  2. email-Enron:Enron公司内部约50万封电子邮件的通信网络数据。节点为电子邮件地址,若地址i向地址j发送过至少一封邮件,则网络中存在一条无向边从i到j。非Enron地址在该网络中作为信息的起点或终点。

  3. wiki-Talk:维基百科用户讨论页面的通信网络数据,基于截至2008年1月的维基百科页面编辑历史。节点代表维基百科用户,有向边表示用户i至少一次编辑过用户j的讨论页面。

  4. comm-f2f-Resistance:基于Resistance游戏中62场游戏的面对面互动网络数据。每场游戏参与者5-8人,时长45-60分钟。使用ICAF算法从自由形式讨论中提取动态网络,并使用DeceptionRank算法表征和检测欺骗行为。网络是加权、有向和时序的,每个节点代表一名参与者,每1/3秒记录一次参与者之间的互动行为。

数据用途概述: 该数据集适用于多种网络科学研究场景:

  1. 用于电子邮件通信网络的结构分析,研究社交网络中的信息传播规律。

  2. 支持社交网络中的社区发现和角色识别,帮助理解群体互动模式。

  3. 适用于欺骗行为检测,通过动态网络分析识别社交网络中的异常行为。

  4. 可用于网络科学教育和培训,帮助研究人员和学生理解实际网络系统的复杂性。

  5. 支持网络拓扑特征提取、信息扩散建模、社交影响力分析等研究工作。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 60.91 MiB
最后更新 2025年4月16日
创建于 2025年4月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。