更多尔蘑菇结果数据集
数据来源:互联网公开数据
标签:更多尔蘑菇,天气数据,时间序列,预测模型,生态学,农业数据
数据概述:
本数据集结合了来自加州大学戴维斯分校农业与资源经济学系的天气信息(基于PRISM气候数据)和来自“Great Morel”网站的更多尔蘑菇的观测记录。数据集旨在通过一系列环境因素预测特定地区更多尔蘑菇的果实时段。数据集的时间序列观测以“邮政编码区域(ZCTA)”和“年份”为唯一标识,每个ZCTA/年份对内包含182个时间索引,对应从1月1日到6月30日(或2020年的7月1日,闰年情况)。这些时间序列代表了“更多尔蘑菇季节”。
该数据集包含以下关键字段:
- ppt:降水(单位为毫米)
- tmax:日最高温度(单位为摄氏度)
- tmin:日最低温度(单位为摄氏度)
- tavg:平均温度(由最高温和最低温计算得出)
- day_length_seconds:基于Python中的astral库计算的近似日长(根据ZCTA的质心坐标)
此外,数据集还包括以下几个目标字段:
- observation:表示在特定ZCTA和日期是否存在更多尔蘑菇的观测记录。由于观测数据通常仅在某一天记录,单次观测可能导致季节范围的低估。
- final_target:一种粗略表示“更多尔蘑菇季节”的目标变量,基于“observation”字段计算:
- 如果只有一个观测记录,则将观测日期前后4天定义为“更多尔季节”。
- 如果有多个观测记录,则“更多尔季节”从第一个观测的前4天到最后一个观测的前4天,包括中间的所有日期。
- final_gaussian_target:一种平滑处理的目标变量,通过高斯分布量化“更多尔季节”的确定性。以观测日期为中心创建高斯分布,标准差为4,对于多个观测记录,所有观测之间的日期填充为1,并在第一个观测之前和最后一个观测之后应用高斯衰减。
数据用途概述:
该数据集适用于更多尔蘑菇生长规律的研究、预测模型的构建以及生态学分析等场景。研究人员可以利用天气数据和观测记录探索更多尔蘑菇的生长与环境因素之间的关系,预测其果实时段。此外,数据集也可用于农业生态学研究,帮助理解环境条件对真菌生长的影响。对于蘑菇爱好者和相关从业者,该数据集提供了宝贵的参考信息,有助于更高效地寻找更多尔蘑菇。
数据示例:
以下是一个包含单次观测的示例数据片段,展示“time_idx”、“observation”和“final_gaussian_target”的关系:
| time_idx | observation | final_gaussian_target |
|-|-||
| 113 | 0.0 | 0.000000 |
| 114 | 0.0 | 0.011109 |
| 115 | 0.0 | 0.022794 |
| 116 | 0.0 | 0.043937 |
| ... | ... | ... |
| 126 | 1.0 | 1.000000 |
| 127 | 0.0 | 0.969233 |
| 128 | 0.0 | 0.882497 |
| ... | ... | ... |
| 139 | 0.0 | 0.000000 |
通过这些数据,可以直观地看到“final_gaussian_target”如何平滑地反映更多尔蘑菇季节的开始和结束。
注意事项:
- 数据集中的目标变量(如“final_target”和“final_gaussian_target”)是基于直觉和经验构建的,而非严格的科学研究结果。
- 由于ZCTA质心的计算未考虑地球曲率和区域形状,日长计算可能存在一定误差,但对近似分析足够精准。
该数据集为研究人员、农业生态学者和更多尔蘑菇爱好者提供了丰富的信息资源,帮助深入理解更多尔蘑菇的生长规律及其与环境的关系。