泰坦尼克号乘客关系数据集-1912年-jankondracki
数据来源:互联网公开数据
标签:泰坦尼克号,乘客关系,数据集,家庭成员,数据分析,历史,教育
数据概述:
本数据集包含了泰坦尼克号乘客的关系信息,基于Kaggle上“Titanic - Machine Learning From Disaster”竞赛中的测试集和训练集合并而成。数据集中新增了4个字段,用于表示乘客的家庭关系:
- Spouse:乘客配偶的PassengerId
- Siblings:乘客兄弟姐妹的PassengerId,多个ID用“/”分隔
- Parents:乘客父母的PassengerId,多个ID用“/”分隔
- Children:乘客子女的PassengerId,多个ID用“/”分隔
在构建此数据集的过程中,对原始泰坦尼克号数据集中与SibSp和Parch字段相关的一些不一致之处进行了修正。
数据用途概述:
该数据集适用于历史事件分析、家庭关系研究、数据分析教学等多种场景。研究人员可以通过分析乘客的家庭关系,了解泰坦尼克号乘客的社会结构和家庭背景。教育者可以利用此数据集进行数据分析课程的教学,帮助学生理解数据清洗、关系构建等数据处理方法。此外,该数据集也为数据科学爱好者提供了探索历史事件的宝贵资源。