数据集概述
本数据集包含纽约州Mesonet(NYSM)127个地面相机日间每5分钟拍摄的图像标注成果,基于标准化标注指南完成四类降水状态(晴朗、降雨、降雪、遮挡)的人工标注,通过两轮标注测试验证了编码者信度(Krippendorff’s alpha达0.926),同时提供标注相关的辅助文件与统计图表。
文件详解
- NYSM_Daytime_Dataset_and_QCA.zip:压缩文件,包含标注代码本(含各类别示例与疑难案例)、编码者信度测试所用图像、信度结果及统计数据表,以及标注时补充的NYSM数据和ASOS数据。
- NYSM_daytime_dataset_class_breakdown.png:PNG格式图像,展示数据集各类别(晴朗、降雨、降雪、遮挡)的分布情况。
- NYSM_daytime_dataset_data_by_station.png:PNG格式图像,展示各NYSM站点的标注数据分布。
适用场景
- 气象AI模型训练:作为监督学习数据集,用于训练降水类型识别的机器学习模型。
- 气象图像标注方法研究:为气象领域图像标注的信度评估、标准化流程设计提供参考案例。
- 气象数据辅助分析:结合标注结果与站点数据,提升降水实况监测及临近预报的准确性。
- 环境科学AI可信性研究:为地球系统科学中可信AI数据集构建提供实践框架参考。