fauci_email_Based_Anthony_Fauci邮件JSON摘要数据_Processed

数据集概述

本数据集是Anthony Fauci在2021年公开的3234页PDF邮件的处理后JSON版本,包含1289个邮件线程、2761封邮件(含101封重复邮件),记录每封邮件的发件人、收件人、抄送、主题、正文、时间戳等信息,还提供5种邮件网络、1个超图、1个时序图、3个张量等衍生JSON文件,助力理解美国政府新冠疫情应对。

文件详解

  • 主数据文件
  • 文件名称:fauci-email-data.json
  • 文件格式:JSON
  • 字段映射介绍:包含1289个邮件线程,每个线程下的邮件记录有sender(发件人)、recipients(收件人)、cc(抄送)、subject(主题)、body(正文)、timestamp(时间戳,若有)等字段
  • 衍生网络文件
  • 文件名称:fauci-email-graph-tofrom-nofauci-nocc-5.json、fauci-email-graph-repliedto-nofauci.json、fauci-email-graph-tofrom-nofauci-cc-5.json
  • 文件格式:JSON
  • 字段映射介绍:以fauci-email-graph-repliedto-nofauci.json为例,包含vertices(顶点)、edges(边)、edgedata(边数据)、labels(标签)、orgs(机构)等字段,记录邮件交互网络结构
  • 时序图文件
  • 文件名称:fauci-email-temporalgraph-tofrom.json
  • 文件格式:JSON
  • 字段映射介绍:记录带时间维度的邮件收发交互时序图数据
  • 超图文件
  • 文件名称:fauci-email-hypergraph.json
  • 文件格式:JSON
  • 字段映射介绍:以超图结构呈现邮件多主体交互关系
  • 张量文件
  • 文件名称:fauci-email-tensor-words-tsc.json、fauci-email-tensor-words.json
  • 文件格式:JSON
  • 字段映射介绍:基于邮件文本的词张量数据,用于文本特征分析

适用场景

  • 疫情政策响应分析:通过邮件内容研究美国政府新冠疫情应对决策过程与关键沟通节点
  • 社会网络分析:利用邮件交互网络、超图数据,分析疫情期间相关人员/机构的沟通关系与影响力
  • 文本挖掘研究:基于邮件正文、主题及词张量数据,开展疫情相关文本的主题聚类、情感分析等NLP任务
  • 公共卫生治理研究:结合邮件时间戳与内容,探究疫情应对措施的时间线与决策逻辑关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.03 MiB
最后更新 2026年1月2日
创建于 2026年1月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。