中国蘑菇分类与安全性评估数据集1963-2021

中国蘑菇分类与安全性评估数据集1963-2021 数据来源:互联网公开数据 标签:蘑菇分类,食品安全,中国,食用安全性,机器学习,数据竞赛,特征分析

数据概述: 本数据集源自中国RAICOM Mission Application Competition,包含来自327起蘑菇中毒事件的研究数据,涉及923名患者和20起死亡案例。数据集涵盖了22种蘑菇的特征属性,包括颜色、形状、纹理等,旨在用于训练和评估蘑菇分类模型,以区分食用蘑菇和有毒蘑菇。数据集的版权属于RAICOM Mission Application Competition的组织者。

数据用途概述: 该数据集适用于蘑菇分类模型的训练和评估,特别是在食品安全领域的应用。研究人员可以利用此数据集来开发和改进蘑菇分类算法,以提高分类的准确性。此外,该数据集还可以用于教育和培训目的,帮助非专业人士学习如何识别蘑菇的特征,从而减少蘑菇中毒的风险。数据集还适用于政策制定者,帮助他们评估蘑菇安全的相关政策和措施的有效性。

举例: 通过分析蘑菇的22种特征属性,参赛者构建了一个蘑菇分类模型,该模型的官方基线结果如下: - 准确率(Accuracy):0.7464 - 精确率(Precision):0.7591 - 召回率(Recall):0.6344 - F1分数(F1 Score):0.6912

模型的混淆矩阵如下: [[2405 468] [ 850 1475]]

其中,2405个样本正确分类为食用蘑菇,468个样本被错误分类为食用蘑菇(假阳性),850个样本被错误分类为有毒蘑菇(假阴性),1475个样本正确分类为有毒蘑菇。

F1分数是精确率和召回率的调和平均值,适用于处理类别不平衡的数据集,特别是在食品安全领域,正确区分有毒和食用蘑菇至关重要。F1分数平衡了精确率和召回率的误差,确保模型在误分类有毒蘑菇为食用蘑菇时的风险最小化。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.38 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。