数据2021年12月泰坦尼克生存预测五折交叉验证数据集

数据2021年12月泰坦尼克生存预测五折交叉验证数据集 数据来源:互联网公开数据 标签:泰坦尼克号,生存预测,机器学习,交叉验证,数据分析,Kaggle,竞赛数据,特征工程 数据概述: 本数据集基于2021年12月Kaggle泰坦尼克号生存预测竞赛的原始数据集,采用五折交叉验证的方式进行构建。数据集包含原始数据经过预处理和特征工程后的多个子集,每个子集对应交叉验证中的一个折叠(fold)。这些子集通常包含了乘客的基本信息(如姓名、性别、年龄、票价、舱位等级等)以及是否幸存的标签。

数据用途概述: 该数据集主要用于机器学习模型的训练和评估,特别适用于解决二分类问题,即预测乘客是否在泰坦尼克号海难中幸存。 数据使用者可以利用该数据集进行模型训练、参数调优、模型比较等工作,从而深入理解数据特征与生存概率之间的关系。 此外,该数据集也适用于教学目的,帮助学生掌握数据预处理、特征工程、模型构建和评估等机器学习实践技能。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 156.39 MiB
最后更新 2025年4月20日
创建于 2025年4月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。