泰坦尼克号乘客生存预测数据集-1912年-muhammadyasirsaleem
数据来源:互联网公开数据
标签:泰坦尼克号,生存预测,乘客,数据分析,机器学习,灾难,历史,社会学
数据概述:
本数据集包含了泰坦尼克号上891名乘客的详细信息,记录了1912年4月15日泰坦尼克号沉没事件中乘客的个人属性和生存情况。数据集共包含12个字段,涵盖了乘客的基本信息、客舱等级、票价、以及是否幸存等关键要素。
字段定义如下:
PassengerId: 乘客唯一ID
Survived: 生存情况 (0 = 否, 1 = 是)
Pclass: 船票等级 (1 = 头等舱, 2 = 二等舱, 3 = 三等舱)
Name: 乘客姓名
Sex: 乘客性别
Age: 乘客年龄
SibSp: 乘客在船上的兄弟姐妹或配偶数量
Parch: 乘客在船上的父母或子女数量
Ticket: 船票号码
Fare: 船票价格
Cabin: 客舱号码
Embarked: 登船港口 (C = Cherbourg, Q = Queenstown, S = Southampton)
数据用途概述:
该数据集广泛应用于数据科学和机器学习领域,主要用于:
生存预测:建立预测模型,根据乘客的特征预测其生存概率。
数据探索性分析 (EDA):通过可视化和统计分析,探索乘客特征与生存之间的关系,例如年龄、性别、舱位等级等因素对生存的影响。
教学与实践:作为经典案例,用于数据分析、机器学习算法的教学和实践。
历史研究:从社会学角度分析泰坦尼克号事件,探究不同社会群体的生存差异。