数据集概述
本数据集为物种空间占用数据建模研究的支撑数据,包含6个合成数据集和2个真实数据集(塞伦盖蒂国家公园汤姆森瞪羚数据、蜜袋鼯数据)。数据旨在结合贝叶斯分层模型与机器学习方法,解决传统模型无法捕捉的非传统空间依赖问题,同时考虑观测误差,共包含5个文件。
文件详解
- Readme.txt
- 文件格式:TXT
- 字段映射介绍:提供数据集说明,包括文件内容概述、数据来源及使用方法等
- Serengeti.zip
- 文件格式:ZIP
- 字段映射介绍:塞伦盖蒂国家公园汤姆森瞪羚数据压缩包,包含相关原始或处理后数据
- Sugarglider.zip
- 文件格式:ZIP
- 字段映射介绍:蜜袋鼯数据压缩包,包含相关原始或处理后数据
- Sugarglider.csv
- 文件格式:CSV
- 字段映射介绍:包含site(站点)、survey1-survey5(5次调查的观测结果)、easting(东向坐标)、northing(北向坐标)、mat200-mat2000(不同尺度的平均温度)、elev(海拔)、d1-d5(环境变量)、temp1-temp5(温度)、wind1-wind5(风力)、moon1-moon3(月相)等字段
- Serengeti.csv
- 文件格式:CSV
- 字段映射介绍:包含long(经度)、lat(纬度)及2012年1月至4月多个日期的物种观测记录字段,记录195个站点的汤姆森瞪羚存在/缺失数据
数据来源
塞伦盖蒂数据来自Hepler et al. (2018)(https://datadryad.org/stash/dataset/doi:10.5061/dryad.34kb373),其余数据为研究团队生成或处理
适用场景
- 物种空间分布建模:用于分析物种空间占用数据中的传统与非传统空间依赖关系
- 生态预测模型优化:结合机器学习方法提升物种分布预测准确性与模型适用性
- 观测误差校正研究:验证模型对假缺失等观测误差的处理能力
- 生态数据方法学研究:为贝叶斯分层模型与机器学习融合的空间生态模型提供数据支撑