印度次级蘑菇分类识别数据集1963-2021
数据来源:互联网公开数据
标签:蘑菇分类,次级数据集,生物信息学,食用性,毒性,数据模拟,物种分布
数据概述:
本数据集包含61069个假设的蘑菇样本,基于173个不同物种(每个物种有353个样本)。每个蘑菇被标识为肯定可食用、肯定有毒或食用性未知且不推荐(后一类被合并为有毒类别)。数据集中的变量包括名义变量和度量变量,均为随机生成的数据。数据集分为按物种排序版本(secondary_data_generated.csv)和随机打乱版本(secondary_data_shuffled.csv),以适应不同的分析需求。
数据用途概述:
该数据集适用于蘑菇分类研究、毒性识别模型开发、食用性预测模型构建等多种应用场景。研究人员可以利用此数据集进行蘑菇物种的分类研究,识别不同特征对蘑菇食用性的影响。开发者可以基于数据集构建机器学习模型,用于蘑菇的自动化分类识别。此外,数据集也适合用于教育培训,帮助学习者理解和掌握蘑菇分类的相关知识和技术。
举例:
数据集中包含的每个蘑菇样本具有如下的特征信息:
- 蘑菇的颜色、大小、形状等外部特征;
- 蘑菇的生长环境信息,如湿度、温度等;
- 蘑菇的内部结构特征,如菌柄长度、菌褶密度等;
- 蘑菇的化学组成信息,如蛋白质含量、糖分含量等;
- 蘑菇的食用性标识,表示该蘑菇是否可以食用、是否有毒等。
基于这些特征信息,研究人员可以构建蘑菇分类识别模型,预测不同特征组合下的蘑菇食用性。