Spatial_Occupancy_Modeling_Based_机器学习空间占用数据建模研究数据

数据集概述

本数据集为物种空间占用数据建模研究的支撑数据,包含6个合成数据集和2个真实数据集(塞伦盖蒂国家公园汤姆森瞪羚数据、蜜袋鼯数据)。数据旨在结合贝叶斯分层模型与机器学习方法,解决传统模型无法捕捉的非传统空间依赖问题,同时考虑观测误差,共包含5个文件。

文件详解

  • Readme.txt
  • 文件格式:TXT
  • 字段映射介绍:提供数据集说明,包括文件内容概述、数据来源及使用方法等
  • Serengeti.zip
  • 文件格式:ZIP
  • 字段映射介绍:塞伦盖蒂国家公园汤姆森瞪羚数据压缩包,包含相关原始或处理后数据
  • Sugarglider.zip
  • 文件格式:ZIP
  • 字段映射介绍:蜜袋鼯数据压缩包,包含相关原始或处理后数据
  • Sugarglider.csv
  • 文件格式:CSV
  • 字段映射介绍:包含site(站点)、survey1-survey5(5次调查的观测结果)、easting(东向坐标)、northing(北向坐标)、mat200-mat2000(不同尺度的平均温度)、elev(海拔)、d1-d5(环境变量)、temp1-temp5(温度)、wind1-wind5(风力)、moon1-moon3(月相)等字段
  • Serengeti.csv
  • 文件格式:CSV
  • 字段映射介绍:包含long(经度)、lat(纬度)及2012年1月至4月多个日期的物种观测记录字段,记录195个站点的汤姆森瞪羚存在/缺失数据

数据来源

塞伦盖蒂数据来自Hepler et al. (2018)(https://datadryad.org/stash/dataset/doi:10.5061/dryad.34kb373),其余数据为研究团队生成或处理

适用场景

  • 物种空间分布建模:用于分析物种空间占用数据中的传统与非传统空间依赖关系
  • 生态预测模型优化:结合机器学习方法提升物种分布预测准确性与模型适用性
  • 观测误差校正研究:验证模型对假缺失等观测误差的处理能力
  • 生态数据方法学研究:为贝叶斯分层模型与机器学习融合的空间生态模型提供数据支撑
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 19.59 MiB
最后更新 2026年1月7日
创建于 2026年1月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。