数据2022大数德比赛马追踪数据分析集

数据2022大数德比赛马追踪数据分析集 数据来源:互联网公开数据 标签:赛马,追踪数据,大数德比,2022,比赛分析,位置,速度,加速,距离

数据概述: 本数据集是2022年大数德比比赛追踪数据的预处理结果,包含赛马在比赛过程中各时间点的位置、速度、加速度等关键信息。数据集适合用于赛马比赛分析、速度模型构建等场景。

数据包含以下字段: program_number - 参赛者编号(非唯一) latitude - 赛马所在位置的纬度(浮点数) longitude - 赛马所在位置的经度(浮点数) time_sec - 观测时间点(从比赛开始计算的秒数) race_id - 比赛唯一标识符 passed_dist - 已跑距离(英尺) speed_mph - 参赛者速度(英里/小时) acceleration - 参赛者加速度或减速度(英里/小时) not_turn - 参赛者位置:True=直线 False=弯道 completed_dist - 包括助跑在内的总跑距离 num_horses - 参赛者数量 position - 比赛中的位置 dist_to_lead - 与领先者之间的距离 speed_diff_avg_num - 参赛者速度与所有参赛者平均速度的差异(英里/小时) speed_diff_avg_% - 参赛者速度与所有参赛者平均速度的差异百分比 gen_avg_speed - 所有参赛者的平均速度

为与原始资源中的信息结合,可使用以下代码生成比赛唯一标识符(race_id): python def race_id(df): df['race_id'] = df['track_id'] + '_' + \ df['race_date'].astype('str') + '_' + \ df['race_number'].astype('str') df.sort_values(['race_date', 'race_number'], inplace=True) df['race_id'] = df['race_id'].map({rid: i for i, rid in enumerate(df['race_id'].unique().tolist())}) return df

数据用途概述: 该数据集适用于赛马比赛分析、速度模型构建、位置预测等场景。研究人员可以利用此数据进行赛马比赛策略的研究;赛马爱好者可以借此了解比赛中的赛马动态;数据科学家可以利用此数据进行机器学习模型的训练与优化。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 384.72 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。