MetaCost_XGBoost训练与评估数据集

数据集概述

该数据集包含两个用于蚀变类型分类的子集:传统数据集(基于原始地球化学数据)和模拟数据集(基于地统计实现生成的代理变量)。同时提供配套MATLAB文件及置信度分析所需文件,支持MetaCost XGBoost模型的训练与评估。

文件详解

  • 传统数据集文件(CSV格式):
  • Trad_Train.csv:训练数据文件,包含原始地球化学特征(如Cu、Au、Mo等)及目标变量Alteration(蚀变类型,如PHY)
  • Trad_Test.csv:测试数据文件,结构与训练文件一致
  • 模拟数据集文件(CSV格式):
  • Simu_Train.csv:模拟训练数据文件,包含基于代理变量的特征(如Cu、Au、Mo等,经高斯尺度归一化可能含负值)及目标变量Alteration
  • Simu_Test.csv:模拟测试数据文件,结构与模拟训练文件一致
  • 压缩包文件:
  • FinalMatlabFiles.zip:包含原始输入文件alldata.csv、置信度分析文件Analysis1.csv和Analysis2.csv
  • 置信度分析文件(CSV格式):
  • Analysis1.csv/Analysis2.csv:含两列数据,列1为预测与真实蚀变类型的匹配/不匹配标识,列2为正确分类概率(分别基于 bootstrap样本和模拟代理变量)

适用场景

  • 机器学习模型训练:用于MetaCost XGBoost模型的训练与评估,对比传统地球化学数据与模拟代理变量的分类效果
  • 地球化学数据分析:研究蚀变类型与地球化学特征/代理变量的关联
  • 置信度分析:基于bootstrap样本或模拟代理变量评估模型分类结果的可靠性
  • 地统计方法应用:探索地统计实现生成代理变量在分类任务中的应用价值
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 120.02 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。