数据集概述
本数据集为论文“Environmental and ecological signals predict food shortages for subtropical Australian flying fox populations, reservoir of Hendra virus”的支持信息,包含1996-2022年澳大利亚亚热带飞狐食物短缺预测的相关数据、配置文件、脚本及笔记本。数据用于通过机器学习模型(GBDT、GLM)预测飞狐食物短缺月份,为亨德拉病毒溢出风险防控提供依据。
文件详解
- 根目录压缩包:
flying-fox-food-shortage.zip,格式ZIP,包含所有子目录及文件
- 数据目录(data):
bat-level_data.csv,格式CSV,蝙蝠层面输入输出数据(如救助中心蝙蝠数量、体重)
environmental_data.csv,格式CSV,气候生态输入输出数据(如季节、厄尔尼诺指数)
- 配置目录(config):
bat_features.txt,格式TXT,GBDT模型用蝙蝠层面特征名称
env_features.txt,格式TXT,GBDT模型用环境层面特征名称
rename.txt,格式TXT,绘图用重命名字典
- 脚本目录(scripts):
HyperparameterTuning.py,格式PY,网格搜索超参数与交叉验证
Metrics.py,格式PY,计算模型准确率、混淆矩阵等性能指标
Plots.py,格式PY,生成建模及可解释AI相关图表
- 笔记本文件:
FlyingFoxFoodShortage.ipynb,格式IPYNB,GBDT模型的数据预处理、训练、推理、评估及绘图
FlyingFoxGLM.ipynb,格式IPYNB,GLM模型的数据预处理、训练、推理、评估及绘图
- 依赖文件:
requirements.txt,格式TXT,项目所需依赖包清单
数据来源
论文“Environmental and ecological signals predict periods of nutritional stress for Eastern Australian flying fox populations”(bioRxiv,DOI:10.1101/2023.12.01.569640)
适用场景
- 生态预测建模:利用气候、蝙蝠特征数据训练飞狐食物短缺预测模型
- 亨德拉病毒溢出风险防控:基于食物短缺预测结果制定病毒传播干预策略
- 机器学习模型优化:通过超参数调优脚本提升GBDT、GLM模型预测性能
- 生态特征分析:探究季节、厄尔尼诺指数等环境因素对飞狐食物资源的影响
- 生物医学数据可视化:使用绘图脚本生成模型结果及特征重要性相关图表