历届国际足联世界杯赛事全面数据分析数据集-1930-2018
数据来源:互联网公开数据
标签:世界杯,足球,赛事,FIFA,数据分析,体育,比赛,球队,球员,统计,历史
数据概述:
本数据集由Joshua C. Fjelstul博士创建,是一个关于国际足联世界杯的全面数据库,涵盖了1930年至2018年间全部21届世界杯赛事。数据库包含27个数据集,总计约110万个数据点,涵盖了世界杯的方方面面。所有数据都经过了广泛的清洗和交叉验证。
数据结构概述:
本数据集共分为5个主要的数据集组:
第一组:基础单元数据集(9个),包含关于世界杯的基本观察单元信息,如:
赛事信息(tournaments):包括主办国家、冠军、赛事日期和赛制等。
国际足联联合会信息(confederations):记录各参赛球队所属的国际足联联合会。
球队信息(teams):记录参赛球队的详细信息。
球员信息(players):记录参赛球员的详细信息。
教练信息(managers):包括教练所属球队和国籍。
裁判信息(referees):包括裁判的国籍和所属联合会。
比赛场地信息(stadiums):记录举办世界杯比赛的场地。
比赛信息(matches):包括比赛阶段、比赛地点、参赛球队和比赛结果。
球员个人奖项信息(awards):记录每届世界杯颁发给球员的个人奖项。
第二组:球队、球员、教练和裁判与赛事的关联数据集(4个),包含:
参赛球队信息(qualified teams):记录每支球队在赛事中的表现。
球队阵容信息(squads):记录每支球队的球员名单、位置和球衣号码。
教练任命信息(manager_appointments):记录教练的所属球队和国籍。
裁判任命信息(referee_appointments):记录裁判的国籍和所属联合会。
第三组:球队、球员、教练和裁判与比赛的关联数据集(4个),包含:
球队出场信息(team_appearances):记录球队的比赛出场情况。
球员出场信息(player_appearances):记录球员的比赛出场情况。
教练出场信息(manager appearances):记录教练的比赛出场情况。
裁判出场信息(referee appearances):记录裁判的比赛出场情况。
第四组:比赛内事件数据集(4个),包含:
进球信息(goals):记录所有进球事件。
点球信息(penalty_kicks):记录点球大战中的点球尝试及结果。
犯规信息(bookings):记录黄牌和红牌。
换人信息(substitutions):记录换人事件。
第五组:赛事级别属性数据集(6个),包含:
主办国家信息(host_countries):记录每个主办国家的表现。
赛事阶段信息(tournament_stages):记录赛事的不同阶段和关键特征。
小组赛分组信息(groups):记录小组赛的组名和球队数量。
小组赛最终排名信息(group_standings):记录小组赛的最终排名。
赛事最终排名信息(tournament_standings):记录每届赛事的最终排名。
个人奖项获得者信息(award_winners):记录每届世界杯的个人奖项获得者。
数据用途概述:
该数据集适用于多种研究和应用场景,包括:
球队、球员、教练和裁判的统计分析。
比赛结果预测。
数据科学技能教学,尤其是在R语言环境下的应用。
深入分析世界杯的历史、趋势和影响因素。