UFC格斗数据集
数据来源:互联网公开数据
标签:UFC,格斗,赛事记录,选手统计,格斗技巧,胜负预测,格斗分析
数据概述:
本数据集收录了UFC组织历史上所有格斗赛事的详细记录,涵盖每场比赛的双方选手信息、比赛细节及胜负结果。数据来源于ufcstats网站,通过使用BeautifulSoup进行网页抓取,并利用Pandas进行数据处理。数据集包括每名选手在比赛前的历史统计数据,如击打次数、击倒次数、降服尝试次数等,并标注了比赛的获胜方。
数据用途概述:
该数据集适用于格斗数据分析、选手表现评估、胜负预测研究、赛事策略制定等多种场景。研究人员可以通过分析历史数据识别影响比赛结果的关键因素;选手和教练可以利用数据优化训练计划;赛事组织方可以借助数据改进赛事运营管理。此外,该数据集也适合用于教育培训,帮助学习者深入了解格斗运动的统计规律和发展趋势。
举例:
每行数据包含了两位选手的综合统计信息,选手分别用“红”和“蓝”表示(对应比赛中的红角和蓝角)。例如,红角选手的统计数据是基于其所有历史比赛(不包括当前比赛)的综合平均值,统计内容包括红角选手对对手造成的伤害、对手对红角选手造成的伤害(在列名中以“opp”表示)等。蓝角选手的数据结构类似。目标变量“Winner”列出了比赛的胜负结果。
数据集中的列定义如下:
R_和B_前缀分别代表红角和蓝角选手的统计数据
opp包含的列是对手对选手造成的伤害的平均值
KD是击倒次数
SIG_STR是有效打击次数(击中次数/尝试次数)
SIG_STR_pct是有效打击百分比
TOTAL_STR是总打击次数(击中次数/尝试次数)
TD是降服次数
TD_pct是降服百分比
SUB_ATT是降服尝试次数
PASS是通过防守者护笼的次数
REV是反转次数
HEAD是有效头部打击次数(击中次数/尝试次数)
BODY是有效躯干打击次数(击中次数/尝试次数)
CLINCH是有效抱摔打击次数(击中次数/尝试次数)
GROUND是有效地面打击次数(击中次数/尝试次数)
win_by是获胜方式
last_round是比赛最后一轮的轮次(例如,如果在第一轮KO获胜,则此值为1)
last_round_time是比赛最后一轮结束的时间
Format是比赛格式(3轮、5轮等)
Referee是裁判姓名
date是比赛日期
location是比赛举办地点
Fight_type是比赛的体重级别及是否为冠军赛
Winner是比赛获胜方
Stance是选手的站姿(正手、反手等)
Height_cms是选手身高(厘米)
Reach_cms是选手臂展(厘米)
Weight_lbs是选手体重(磅)
age是选手年龄
title_bout是否为冠军赛(布尔值)
weight_class是比赛的体重级别(雏量级、重量级、女子蝇量级等)
no_of_rounds是比赛预定的轮数
current_lose_streak是选手当前连续失败次数
current_win_streak是选手当前连续获胜次数
draw是选手在UFC职业生涯中的平局次数
wins是选手在UFC职业生涯中的获胜次数
losses是选手在UFC职业生涯中的失败次数
total_rounds_fought是选手平均参加的总轮次数
total_time_fought(seconds)是选手总共参加的比赛时间(秒)
total_title_bouts是选手参加的冠军赛总次数
win_by_Decision_Majority是选手在UFC职业生涯中通过多数判决获胜的次数
win_by_Decision_Split是选手在UFC职业生涯中通过分歧判决获胜的次数
win_by_Decision_Unanimous是选手在UFC职业生涯中通过一致判决获胜的次数
win_by_KO/TKO是选手在UFC职业生涯中通过KO/TKO获胜的次数
win_by_Submission是选手在UFC职业生涯中通过降服获胜的次数
win_by_TKO_Doctor_Stoppage是选手在UFC职业生涯中通过医生停止获胜的次数