数据集概述
本数据集包含机器学习训练数据及模型结果,涵盖训练数据、模型评估指标、性能测试与训练指标等内容,支持对机器学习模型的训练过程及效果进行分析。数据集包含五个文件,以CSV格式为主,另有一个Excel文件用于模型对比。
文件详解
- 文件名称:comparison_8ML.xlsx
- 文件格式:XLSX
- 字段映射介绍:未提供具体字段,推测为8种机器学习模型的对比数据
- 文件名称:SFB_aug_all.csv
- 文件格式:CSV
- 字段映射介绍:包含Sal(盐度)、SSC(悬浮物浓度)、G、size(尺寸)、settling velocity(沉降速度)等特征字段
- 文件名称:model_evaluation.csv
- 文件格式:CSV
- 字段映射介绍:包含Model(模型名称)、RMSE(均方根误差)、R2(决定系数)、r(相关系数)、NSE(纳什系数)、KGE(克林-古普塔效率系数)、WI(威尔莫特指数)等模型评估指标字段
- 文件名称:performance_metrics_test.csv
- 文件格式:CSV
- 字段映射介绍:未提供具体字段,推测为模型测试集的性能指标数据
- 文件名称:performance_metrics_train.csv
- 文件格式:CSV
- 字段映射介绍:未提供具体字段,推测为模型训练集的性能指标数据
适用场景
- 机器学习模型训练: 使用SFB_aug_all.csv中的特征数据进行模型训练
- 模型性能评估: 利用model_evaluation.csv、performance_metrics_test.csv和performance_metrics_train.csv分析模型的各项评估指标
- 模型对比分析: 通过comparison_8ML.xlsx对比不同机器学习模型的性能差异
- 特征相关性研究: 基于SFB_aug_all.csv中的特征字段,分析各特征与目标变量的相关性
- 机器学习实验复现: 结合训练数据与模型结果,复现机器学习实验过程与结论