岩壁攀登数据集-2011至2021年-jordizar
数据来源:互联网公开数据
标签:攀岩,数据集,攀登,攀登路线,攀岩者,评级,数据清理,聚类分析,PCA
数据概述:
本数据集基于原始数据集(由David Cohen从8a.nu网站抓取的数据集),包含3个经过清理和整理后的表格,旨在为攀登爱好者和数据工程师提供丰富的攀登数据分析资源。数据集涵盖2011年至2021年间攀登记录,包括攀登路线的评分、攀登者信息以及攀登路线的聚类分析结果。
数据包含以下三个表格:
1. 评分转换表(grades_conversion_table.csv):提供数字评级与法语评级之间的转换关系。
2. 攀登路线表(routes_rated.csv):记录了各攀登路线的详细信息,包括路线ID、平均难度评分、总评分、推荐度汇总及聚类标签。
3. 攀登者信息表(climber_df.csv):记录了各攀登者的基本信息,包括首次和最后一次攀登日期、首次和最后一次攀登的难度等级、攀登年数及完成的路线数量等。
数据用途概述:
该数据集适用于多种研究和分析场景,包括攀登数据分析、攀登路线推荐系统开发、攀登者行为模式研究、攀登难度评估等。研究人员可以利用该数据集进行攀登难度分析、推荐系统构建、攀登者行为模式研究等;攀登爱好者可以通过探索数据集了解不同攀登路线的难度和受欢迎程度,提升攀登技能。
数据集获取:
若需了解如何从原始数据中生成以上三个表格,请访问以下GitHub仓库链接:
- 攀登者信息表生成代码:https://github.com/jordi-zaragoza/Climbing-Data-Analysis/blob/master/src/1.Project_clean.ipynb
- 攀登路线表生成代码:https://github.com/jordi-zaragoza/Climbing-Route-Recommender/blob/master/src/1.get_routes_table.ipynb
致谢:
感谢David Cohen(https://www.kaggle.com/datasets/dcohen21/8anu-climbing-logbook)提供的原始数据支持。