数据集

蘑菇分类预测数据集MushroomClassificationPredictionDataset-mohamedabder

数据来源：互联网公开数据

标签：蘑菇分类, 机器学习, 分类预测, 数据预处理, 特征工程, 蘑菇属性, 风险评估, 模型训练

数据概述：该数据集包含经过预处理的蘑菇属性数据，旨在用于训练机器学习模型，以预测蘑菇的可食用性。主要特征如下：时间跨度：数据未标明具体时间，可视为静态数据集。地理范围：数据未明确标注地理范围，但涵盖了蘑菇的多种属性特征，适用于全球范围内的蘑菇分类研究。数据维度：数据集包含多个特征，如蘑菇的“cap-diameter”（菌盖直径）、“cap-shape”（菌盖形状）、“cap-surface”（菌盖表面）、“cap-color”（菌盖颜色）、“does-bruise-or-bleed”（是否变色）、“gill-attachment”（菌褶附着方式）、“gill-spacing”（菌褶间距）、“gill-color”（菌褶颜色）、“stem-height”（菌柄高度）、“stem-width”（菌柄宽度）、“stem-color”（菌柄颜色）、“has-ring”（是否有环）、“ring-type”（环的类型）、“habitat”（栖息地）、“season”（季节）以及“class”（类别，表示可食用性，0为可食用，1为有毒）。数据格式：数据集以CSV格式提供，包含df_preprocessed.csv和preprocessed_test.csv两个文件，分别包含预处理后的训练数据和测试数据。此外，还提供了用于模型训练的各种预处理工具和已训练的模型，如特征编码器（feature_encoders.pkl）、缺失值填充器（imputer_mediane.pkl和imputer_mode.pkl）、标签编码器（label_encoders.pkl）、数据缩放器（scaler.pkl）以及训练好的随机森林分类器（RandomForestClassifier.pkl）和XGBoost分类器（XGBClassifier.pkl）。来源信息：数据来源于公开的蘑菇数据集，并经过了预处理，包括数值化、缺失值处理和特征缩放等。该数据集特别适合用于机器学习分类任务。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于机器学习、数据挖掘等领域的学术研究，重点在于蘑菇分类、特征重要性分析和模型优化等。行业应用：可应用于食品安全领域，用于开发蘑菇毒性预测系统，辅助蘑菇采摘者进行风险评估。决策支持：支持风险评估决策，帮助相关机构建立蘑菇安全监管体系，降低误食有毒蘑菇的风险。教育和培训：作为机器学习课程的实训案例，帮助学生和研究人员掌握数据预处理、特征工程、模型训练与评估的流程。此数据集特别适合用于探索蘑菇属性与可食用性之间的关系，构建高精度的蘑菇分类模型，并应用于实际的风险评估和决策支持中。

数据与资源

versions_20250314211721.zipZIP
176.09 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	176.09 MiB
最后更新	2025年5月29日
创建于	2025年5月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

蘑菇分类预测数据集MushroomClassificationPredictionDataset-mohamedabder

数据与资源

附加信息

注册成功！