数据集

社交媒体灾害相关讨论数据集

社交媒体灾害相关讨论数据集数据来源：互联网公开数据
标签：社交媒体,灾害事件,事件分析,公众情绪,社会互动,紧急响应,灾害研究

数据概述：
本数据集包含超过10,000条与全球灾害事件相关的推文记录，每条推文均经过人工标注，判断其是否与实际灾害相关。数据集通过关键词（如“ablaze”、“pandemonium”等）筛选出与灾害事件相关的推文，并对每条推文进行了详细的标注和注释。数据集中的每条记录包含推文的元数据、关键词相关性、地理位置、文本内容等信息，为研究灾害事件在社交媒体中的传播和讨论提供了丰富的数据支持。

数据用途概述：
该数据集适用于以下场景：
1. 灾害应对与管理：通过分析推文内容，了解公众在灾害发生时的反应、情绪和需求，为灾害管理提供参考。
2. 灾害预警与预测：利用推文中的关键词和模式，结合历史数据，开发预测模型，提前识别潜在的灾害事件。
3. 灾害影响评估：通过分析灾害发生期间的推文内容，评估灾害对社会、经济和心理的影响。
4. 灾害响应效果评估：将推文数据与实际灾害影响区域和救援活动进行对比，评估灾害响应措施的有效性。
5. 公众情绪研究：研究灾害事件期间公众情绪的变化，为危机沟通和信息传播提供策略建议。

数据字段说明：
1. _golden：布尔值，表示该推文是否为“黄金推文”（经过严格标注）。
2. _unit_state：字符串，表示推文的状态（例如“finalized”、“judged”等）。
3. _trusted_judgments：整数，表示对该推文进行标注的可信判断次数。
4. _last_judgment_at：日期时间，表示最后一次对该推文进行标注的时间。
5. choose_one：字符串，表示推文的标签（例如“relevant”、“not relevant”等）。
6. choose_one_gold：字符串，表示推文的“黄金标签”（例如“relevant”、“not relevant”等）。
7. keyword：字符串，表示与推文相关的关键词。
8. location：字符串，表示推文的地理位置（如果可用）。
9. text：字符串，表示推文的文本内容。
10. tweetid：字符串，表示推文的唯一标识符。
11. userid：字符串，表示发布推文的用户的唯一标识符。

数据特征：
- 时间范围：数据集中的推文覆盖了不同年份和事件，时间跨度大，具有较好的代表性。
- 事件类型：涵盖了自然灾害（如地震、洪水）、公共卫生事件（如传染病爆发）和冲突事件等多种灾害类型。
- 语言和地域：推文主要以英语为主，覆盖全球多个地区，反映了不同文化背景下的公众反应。
- 标注质量：推文经过人工标注，特别是“黄金推文”提供了较高的数据可靠性。

数据应用场景：
1. 灾害响应策略优化：通过分析推文中的公众需求和情绪，优化灾害响应措施，提升救援效率。
2. 灾害预警系统开发：利用社交媒体中的关键词和模式，开发实时灾害预警系统，提前识别潜在灾害风险。
3. 灾害影响评估研究：结合推文数据和实际灾害数据，评估灾害对社会和经济的综合影响，为政策制定提供依据。
4. 公众情绪分析：研究灾害事件期间的公众情绪变化，为危机沟通和信息传播提供参考。
5. 灾害应对培训与教育：利用数据集中的案例，为应急响应人员和研究人员提供培训材料，提升应对灾害的能力。

数据价值：
该数据集为灾害研究、应急管理和公众情绪分析等领域提供了宝贵的数据支持，有助于推动灾害应对和管理的科学化和智能化，同时为灾害预防和救援工作提供重要的参考依据。

数据与资源

社交媒体灾害相关讨论数据集.zipZIP
0.77 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.77 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

社交媒体灾害相关讨论数据集

数据与资源

附加信息

注册成功！