数据集概述
该数据集围绕体育(FIFA世界杯)、自然灾害(地震)、气候变化(全球变暖)三大领域的新闻信息传播展开,包含多语言新闻文章及元数据,为研究不同事件的信息传播特征提供支持。
文件详解
- 核心数据文件(CSV格式):
- FIFAWorldCup - Metadata.csv:FIFA世界杯事件的元数据文件
- Earthquake - Metadata.csv:地震事件的元数据文件
- GlobalWarming - Metadata.csv:全球变暖事件的元数据文件
- Classification-Economic-test - L.csv:经济分类测试数据文件,字段包括from、event、status、from-time、Country、cosine相似度、class、各类指标得分等
- TimezonalF.csv:时区相关数据文件,字段包括from、event、status、from-time、Country、Time Zone-f、GMT Offset-f、class等
- GlobalWarming.csv:全球变暖事件的主数据文件
- GeoF.csv、EconomicalF.csv、CulturalF.csv:地理、经济、文化维度的特征数据文件
- 新闻文章归档文件(ZIP格式):
- FIFA World Cup - News Articles.zip:FIFA世界杯事件的新闻文章压缩包
- Earthquake - News Articles.zip:地震事件的新闻文章压缩包
- Global Warming - News Articles.zip:全球变暖事件的新闻文章压缩包
数据来源
EventRegistry全球媒体监测系统
适用场景
- 信息传播研究:分析不同领域事件的新闻传播范围、内容变化及跨语言传播特征
- 跨文化传播分析:探究文化价值观对新闻信息传播的影响
- 自然语言处理应用:用于新闻分类、传播路径预测等机器学习任务
- 社会科学研究:研究经济、政治、地理等因素对新闻传播的阻碍作用
- 媒体效果评估:评估不同语言、地区媒体对重大事件的报道差异