社交媒体灾害信息标注数据集SocialMediaDisasterInformationAnnotationDataset-mohammadabdul312

社交媒体灾害信息标注数据集SocialMediaDisasterInformationAnnotationDataset-mohammadabdul312

数据来源:互联网公开数据

标签:社交媒体, 灾害信息, 图像识别, 文本分析, 数据标注, 人工智能, 机器学习, 灾害救援

数据概述: 该数据集包含来自社交媒体的数据,记录了关于灾害事件的文本和图像信息,并附带了详细的人工标注。主要特征如下: 时间跨度:数据未明确标注时间范围,可以被视为一个静态的、用于训练和评估的数据集。 地理范围:数据来源未明确标注地理范围,但根据内容推测可能涵盖全球范围内的灾害事件。 数据维度:数据集包括多个关键字段,如tweet_id(推文ID)、image_id(图像ID)、text_info(文本信息分类)、text_info_conf(文本信息置信度)、image_info(图像信息分类)、image_info_conf(图像信息置信度)、text_human(文本人工标注)、text_human_conf(文本人工标注置信度)、image_human(图像人工标注)、image_human_conf(图像人工标注置信度)、image_damage(图像损坏情况)、image_damage_conf(图像损坏置信度)、tweet_text(推文文本)、image_url(图像链接)、image_path(图像路径)、structure_type(结构类型)、preprocess_tweet_text(预处理后的推文文本)、damage(损坏情况)和structure(结构)。 数据格式:数据集以CSV格式存储,包含多个文件,便于数据分析和处理。 来源信息:数据来源于社交媒体平台,并经过人工标注,提供了文本和图像信息的分类和置信度。 该数据集适合用于灾害信息分析、图像识别、文本分类和多模态数据分析。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于灾害管理、社会计算和人工智能领域的学术研究,如灾害事件检测、信息真实性分析、救援需求评估等。 行业应用:可以为灾害响应机构、新闻媒体和社交媒体平台提供数据支持,用于灾害预警、信息传播和救援资源分配。 决策支持:支持政府和非政府组织在灾害发生时的决策制定和资源调配。 教育和培训:作为人工智能、机器学习和自然语言处理课程的辅助材料,帮助学生和研究人员深入理解灾害信息分析。 此数据集特别适合用于构建和评估用于灾害事件检测、信息分类和救援需求评估的机器学习模型,从而提升灾害响应的效率和准确性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.32 MiB
最后更新 2025年5月1日
创建于 2025年5月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。