土耳其地震推文数据集

土耳其地震推文数据集 数据来源:互联网公开数据
标签:地震,推文,紧急呼吁,救援,文本标注,BERT模型,自然语言处理,社会应急响应

数据概述:
本数据集包含2020年伊兹密尔地震发生后,与地震相关的土耳其推文数据,主要分为三个部分:
1. "izmir_earthquake_labeled.csv":包含4000条经过人工标注的推文,标注内容为推文是否属于紧急呼吁信息(rescue列)。
2. "izmir_earthquake.csv":包含地震发生后第一周内的相关推文。
3. "izmir_earthquake_auto_annotated.csv":通过微调的BERT模型对推文进行自动预测,结果存储在preds列中。

数据用途概述:
该数据集适用于以下场景:
1. 紧急信息检测与分类:可用于训练或评估文本分类模型,以识别推文中的紧急呼吁信息。
2. 自然语言处理研究:研究人员可利用数据集探索BERT模型在紧急文本标注中的应用效果。
3. 社会应急响应分析:可用于研究地震事件中公众的应急行为模式及信息传播特征。
4. 教育与研究:数据集可作为教学案例,帮助学生理解社会应急响应中的文本分析方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 97.05 MiB
最后更新 2025年4月17日
创建于 2025年4月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。