数据集概述
该数据集包含土壤湿度与海表温度相关数据,涵盖原始NetCDF4格式数据、CSV格式整理数据,以及记录数据处理步骤的R Markdown文档与PDF,为Wikle et al. (2022) 论文中环境数据机器学习可解释性模型的开发与演示提供支持。
文件详解
- 原始数据文件(.nc格式):
- NOAA_NCDC_ERSST_v5anom_011948-122021.nc:海表温度异常数据,时间范围1948年1月至2021年12月
- NOAA_NCEP_CPC_GMSM_w_Borneo_011948-122021.nc:婆罗洲区域土壤湿度数据,时间范围1948年1月至2021年12月
- NOAA_NCEP_CPC_GMSM_w_US_011948-122021.nc:美国区域土壤湿度数据,时间范围1948年1月至2021年12月
- 数据处理文档:
- extract_data.Rmd:R Markdown格式的数据提取与处理步骤文档
- extract_data.pdf:数据处理步骤的PDF版本
- 压缩数据文件:
- NOAA_Data_CSVd.zip:CSV格式整理后的NOAA数据压缩包
数据来源
NOAA的NCEP和NCDC数据存储系统
适用场景
- 环境数据科学研究:用于验证和演示机器学习模型在环境数据中的可解释性方法
- 气候数据分析:支持土壤湿度与海表温度的长期趋势及区域差异研究
- 模型开发辅助:为Environmetrics期刊"环境数据科学"专题的相关模型提供数据支撑
- 数据处理流程参考:作为环境数据从原始格式转换为分析格式的实践案例