数据2022大数德比赛马追踪数据分析集
数据来源:互联网公开数据
标签:赛马,追踪数据,大数德比,2022,比赛分析,位置,速度,加速,距离
数据概述:
本数据集是2022年大数德比比赛追踪数据的预处理结果,包含赛马在比赛过程中各时间点的位置、速度、加速度等关键信息。数据集适合用于赛马比赛分析、速度模型构建等场景。
数据包含以下字段:
program_number - 参赛者编号(非唯一)
latitude - 赛马所在位置的纬度(浮点数)
longitude - 赛马所在位置的经度(浮点数)
time_sec - 观测时间点(从比赛开始计算的秒数)
race_id - 比赛唯一标识符
passed_dist - 已跑距离(英尺)
speed_mph - 参赛者速度(英里/小时)
acceleration - 参赛者加速度或减速度(英里/小时)
not_turn - 参赛者位置:True=直线 False=弯道
completed_dist - 包括助跑在内的总跑距离
num_horses - 参赛者数量
position - 比赛中的位置
dist_to_lead - 与领先者之间的距离
speed_diff_avg_num - 参赛者速度与所有参赛者平均速度的差异(英里/小时)
speed_diff_avg_% - 参赛者速度与所有参赛者平均速度的差异百分比
gen_avg_speed - 所有参赛者的平均速度
为与原始资源中的信息结合,可使用以下代码生成比赛唯一标识符(race_id):
python
def race_id(df):
df['race_id'] = df['track_id'] + '_' + \
df['race_date'].astype('str') + '_' + \
df['race_number'].astype('str')
df.sort_values(['race_date', 'race_number'], inplace=True)
df['race_id'] = df['race_id'].map({rid: i for i, rid in enumerate(df['race_id'].unique().tolist())})
return df
数据用途概述:
该数据集适用于赛马比赛分析、速度模型构建、位置预测等场景。研究人员可以利用此数据进行赛马比赛策略的研究;赛马爱好者可以借此了解比赛中的赛马动态;数据科学家可以利用此数据进行机器学习模型的训练与优化。