大众媒体中人群事故报道数据集

数据集概述

该数据集包含对人群事故相关新闻报道语料库的分析结果,按类别组织文件以支持在线可视化和离线分析。内容涵盖新闻报道源信息、维基百科语料库、词汇分析结果及情感分析数据,为研究媒体对人群事故的呈现提供多维度支持。

文件详解

  • 分类0(0_data_all.zip):所有文件的结构化压缩包,便于直接下载和分析,包含词汇分析、情感分析等全部数据。
  • 分类1(源信息文件):
  • 1_sources_info.csv:CSV格式,提供数据集复现所需的源信息
  • 1_list_wiki_report.csv:CSV格式,包含维基百科报道的ID、事故日期、来源、聚集目的及URL
  • 1_list_news_report.csv:CSV格式,包含新闻报道的相关元数据
  • 分类2(词汇分析文件):
  • 2_lexical_analysis_files.zip:词汇分析结果压缩包
  • 2_lexical_analysis_maps.zip:词汇分析图谱PNG图片压缩包
  • 2_lexical_analysis_app_VOSviewer.html:HTML格式,可通过浏览器打开以使用VOSviewer在线可视化词汇分析结果
  • 分类3(情感分析文件):
  • 3_sentiment_title.csv:CSV格式,包含报道标题的情感分析结果(悲伤、喜悦、爱、愤怒、恐惧、惊讶六个维度)
  • 3_sentiment_body.csv:CSV格式,包含报道正文的情感分析结果
  • 分类4(维基百科语料库文件):
  • 4_wiki_corpus_before.txt:TXT格式,2022年10月15日前的维基百科人群事故语料库
  • 4_wiki_corpus_after.txt:TXT格式,2023年5月25日后的维基百科人群事故语料库

适用场景

  • 媒体研究:分析大众媒体对人群事故的报道框架与叙事特征
  • 情感分析:探究新闻标题与正文对人群事故的情感倾向差异
  • 词汇学研究:通过词汇分析结果研究媒体报道中的关键词分布与语义网络
  • 信息传播研究:基于报道源信息分析人群事故相关信息的传播路径与来源可靠性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 283.83 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。