数据集概述
该数据集是支持蚊子繁殖地检测、水面分割及可解释AI自然语言推理的多模态数据集,包含繁殖地检测、水面分割和文本推理生成三个核心组件,为相关AI模型训练与评估提供基准数据。
文件详解
数据集包含以下文件:
- 文件名称: VisText-Mosquito A Multimodal Dataset for Mosquito/Breeding Place Detection.zip,格式为ZIP,可能包含1828张繁殖地检测图像及3752条标注数据(涵盖椰子外果皮、花瓶、轮胎等五类)
- 文件名称: VisText-Mosquito A Multimodal Dataset for Mosquito/Water Surface Segmentation.zip,格式为ZIP,可能包含142张水面分割图像及253条标注数据(涵盖带水花瓶、带水轮胎两类)
- 文件名称: VisText-Mosquito A Multimodal Dataset for Mosquito/image_discription.csv,格式为CSV,包含filename(文件名)、Question(问题)、Response(回答)、Reasoning(推理)字段,记录图像对应的自然语言推理说明
适用场景
- 计算机视觉研究:用于训练和评估蚊子繁殖地目标检测、水面分割模型
- 自然语言处理研究:探索图像语义与文本推理的关联,优化可解释AI的推理生成能力
- 公共卫生应用:为开发可解释的蚊子防控AI解决方案提供数据支持
- 多模态学习研究:推动检测、分割与文本推理结合的多模态模型发展