泰坦尼克号宇宙飞船乘客运输预测数据集-davinascimento
数据来源:互联网公开数据
标签:宇宙飞船,乘客,运输,预测,竞赛,空间,旅行,生存,特征工程
数据概述:
本数据集包含约8700名乘客的个人记录,这些乘客搭乘“泰坦尼克号”宇宙飞船。数据集旨在预测乘客是否被运输到另一个维度,是Kaggle竞赛“Spaceship Titanic”所使用的数据集。 数据集包含了乘客的各种信息,旨在帮助研究人员构建预测模型,理解影响乘客运输的关键因素。
数据字段包括:
PassengerId:乘客的唯一标识符。
HomePlanet:乘客出发的星球,通常是他们的家园或永久居住地。
CryoSleep:指示乘客是否选择在航行期间进入休眠状态。
Cabin:分配给乘客住宿的舱位号。
Destination:乘客将下船的星球。
Age:乘客的年龄。
VIP:指示乘客在航行期间是否支付了VIP服务费用。
RoomService:乘客在客房服务上花费的金额。
FoodCourt:乘客在美食广场花费的金额。
ShoppingMall:乘客在购物中心花费的金额。
Spa:乘客在水疗中心花费的金额。
VRDeck:乘客在使用VR甲板上花费的金额。
Name:乘客的姓名。
Transported:指示乘客是否被运输到另一个维度。
数据用途概述:
该数据集主要用于构建机器学习模型,预测“泰坦尼克号”宇宙飞船上的乘客是否被运输到另一个维度。 适用于数据科学竞赛、机器学习算法研究、特征工程方法探索等场景。 研究人员可以利用此数据分析不同因素对乘客运输的影响,例如年龄、舱位、消费习惯等。 同时,该数据集也常被用于教学,帮助学生理解数据分析流程和机器学习建模过程。