中国蘑菇分类与安全性评估数据集1963-2021
数据来源:互联网公开数据
标签:蘑菇分类,食品安全,中国,食用安全性,机器学习,数据竞赛,特征分析
数据概述:
本数据集源自中国RAICOM Mission Application Competition,包含来自327起蘑菇中毒事件的研究数据,涉及923名患者和20起死亡案例。数据集涵盖了22种蘑菇的特征属性,包括颜色、形状、纹理等,旨在用于训练和评估蘑菇分类模型,以区分食用蘑菇和有毒蘑菇。数据集的版权属于RAICOM Mission Application Competition的组织者。
数据用途概述:
该数据集适用于蘑菇分类模型的训练和评估,特别是在食品安全领域的应用。研究人员可以利用此数据集来开发和改进蘑菇分类算法,以提高分类的准确性。此外,该数据集还可以用于教育和培训目的,帮助非专业人士学习如何识别蘑菇的特征,从而减少蘑菇中毒的风险。数据集还适用于政策制定者,帮助他们评估蘑菇安全的相关政策和措施的有效性。
举例:
通过分析蘑菇的22种特征属性,参赛者构建了一个蘑菇分类模型,该模型的官方基线结果如下:
- 准确率(Accuracy):0.7464
- 精确率(Precision):0.7591
- 召回率(Recall):0.6344
- F1分数(F1 Score):0.6912
模型的混淆矩阵如下:
[[2405 468]
[ 850 1475]]
其中,2405个样本正确分类为食用蘑菇,468个样本被错误分类为食用蘑菇(假阳性),850个样本被错误分类为有毒蘑菇(假阴性),1475个样本正确分类为有毒蘑菇。
F1分数是精确率和召回率的调和平均值,适用于处理类别不平衡的数据集,特别是在食品安全领域,正确区分有毒和食用蘑菇至关重要。F1分数平衡了精确率和召回率的误差,确保模型在误分类有毒蘑菇为食用蘑菇时的风险最小化。