新冠疫情接触者追踪关联网络数据集COVID-19ContactTracingNetworkDataset-shubhamkarjini
数据来源:互联网公开数据
标签:新冠疫情, 接触者追踪, 社交网络分析, 流行病学, 图神经网络, 关系建模, 数据可视化, 时序分析
数据概述:
该数据集包含来自公共卫生机构的数据,记录了新冠病毒(COVID-19)疫情期间的接触者追踪信息,并将其构建成关联网络。主要特征如下:
时间跨度:数据的时间跨度依赖于具体的时间戳信息,但未直接标明起始和结束时间,需要结合confirmed_date字段进行分析。
地理范围:数据可能覆盖特定地区或城市,如首尔(Seoul),但具体范围取决于数据来源。
数据维度:数据集由两部分组成:
edges_2csv:包含节点间的关系,字段包括id_1(唯一标识符)、Source(源节点ID)、Target(目标节点ID)和Label(关系类型,如“contact with patient”)。
nodes_2csv:包含节点属性,字段包括id_1(唯一标识符)、ID(节点ID)、Label(节点标签,如城市)、age(年龄段)、sex(性别)、state(状态,如“released”)、confirmed_date(确诊日期)、latitude(纬度)、longitude(经度)和month(月份)。
数据格式:数据集以CSV格式提供,包含edges_2csv和nodes_2csv两个文件,便于数据分析和网络构建。数据还包含features.pt文件,可能包含节点或边的特征信息,用于图神经网络等模型。
来源信息:数据来源于公共卫生机构或相关研究机构,已进行匿名化处理,但保留了关键的关联信息。
该数据集适合用于流行病学研究、社交网络分析以及图神经网络模型训练。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于流行病学、公共卫生和社交网络分析领域的学术研究,如疫情传播动力学分析、接触者追踪效率评估、社交网络结构对病毒传播的影响研究等。
行业应用:为公共卫生部门和医疗机构提供数据支持,尤其在疫情风险评估、传播预测、资源分配优化等方面具备实用性。
决策支持:支持公共卫生决策的制定,如隔离政策优化、疫苗接种策略制定等。
教育和培训:作为流行病学、数据科学和社交网络分析等课程的实训材料,帮助学生和研究人员深入理解疫情传播规律。
此数据集特别适合用于探索病毒传播路径、评估接触者追踪策略的有效性、分析人口统计学特征与病毒传播之间的关系,并支持构建预测模型。