数据集概述
本数据集记录2021-2024年中日两国关于福岛核污染水排放的话语内容,来源包括政府声明、官方媒体(如人民日报、朝日新闻、共同社)和社交媒体(如微博、5ch)。通过LDA主题建模和聚类分析,提取关键词、主题聚类、框架模式及频率统计,支持中日话语框架比较与风险沟通研究。
文件详解
- 文件名称:CN_official.xlsx
- 文件格式:XLSX
- 字段映射介绍:中国官方话语数据,包含文本内容、日期、来源及LDA主题分配
- 文件名称:CN_civil.xlsx
- 文件格式:XLSX
- 字段映射介绍:中国民间话语数据,包含社交媒体帖子、用户ID及主题聚类结果
- 文件名称:JP_combined_lda_topics.xlsx
- 文件格式:XLSX
- 字段映射介绍:日本综合LDA主题结果,包含主题关键词、文档-主题分布及框架频率
- 文件名称:JP_combined_top50_tokens.csv
- 文件格式:CSV
- 字段映射介绍:日本高频词汇统计,如"について"(46071次)、"実施"(17316次),含token和count字段
适用场景
- 框架竞争比较研究:分析中日两国在福岛核污染水排放议题上的话语框架差异
- 风险沟通研究:探讨政府、媒体和公众在核污染水排放事件中的风险沟通策略
- 环境治理研究:为全球风险治理中的国际合法性和话语权研究提供实证依据
- 话语分析:通过LDA主题建模和聚类,识别不同话语主体的框架模式和关键词特征