数据集概述
本数据集包含2020年1月1日至2021年5月31日期间,CNN和FOX两家媒体对中国新冠疫情的书面新闻报道数据。研究人员通过Python软件,以“Coronavirus + China”“Covid-19 + China”为关键词,分别从CNN和FOX的健康板块抓取了4272篇和4167篇文章,数据集共包含5个文件。
文件详解
- 数据文件
- 文件名称:foxnews original data.xlsx
- 文件格式:XLSX
- 字段映射介绍:FOX媒体关于中国新冠疫情的原始新闻报道数据
- 文件名称:CNN original data.xlsx
- 文件格式:XLSX
- 字段映射介绍:CNN媒体关于中国新冠疫情的原始新闻报道数据
- 文件名称:Result.xlsx
- 文件格式:XLSX
- 字段映射介绍:新闻报道数据的处理结果文件
- 代码文件
- 文件名称:Data.py
- 文件格式:PY
- 字段映射介绍:用于抓取和处理新闻报道数据的Python代码文件
- 文件名称:keyword co-occurrence frequency.py
- 文件格式:PY
- 字段映射介绍:用于分析关键词共现频率的Python代码文件
适用场景
- 新闻媒体报道分析:研究中美媒体对中国新冠疫情的报道内容、倾向和重点
- 关键词分析:分析“Coronavirus + China”“Covid-19 + China”等关键词在新闻报道中的出现频率和共现情况
- 疫情舆情研究:通过媒体报道数据研究疫情期间的舆情动态和传播规律
- 跨媒体比较研究:对比CNN和FOX两家媒体对中国新冠疫情报道的差异和共同点