BGG排名桌游数据集-2011至2023年
数据来源:互联网公开数据
标签:桌游,排名,分类,机制,主题,子领域,重新实现,数据科学,游戏分析
数据概述:
本数据集来源于BoardGameGeek(BGG)网站,包含2011年至2023年间桌游的基本信息、机制分类、主题分类、子领域分类以及重新实现信息。数据集旨在比较2017年和2023年使用的机制分类系统的分类能力,并探索重新实现的游戏是否通常排名高于其原始游戏。
数据集包括以下文件:
- basic_data_2023.csv:包含游戏的基本信息,如评分和排名、玩家人数、游戏时长、发行年份和难度。还包括设计师信息。
- mechanisms_2023.csv:一个二进制矩阵,包含所有桌游的机制分类。
- themes_2023.csv:一个二进制矩阵,包含所有桌游的主题分类。
- subdomains_2023.csv:一个二进制矩阵,包含所有桌游的子领域分类。
- reimplementations_2023.csv:包含排名前2000的重新实现游戏的信息,包括游戏ID、父游戏ID、游戏类型(重新实现、扩展或合集)以及实现次数(2表示第一次重新实现,3表示第二次等)。
数据来源:
- 使用BGG提供的API和Beautiful Soup进行网页抓取。
- 数据集还包括用于构建虚拟变量和比较随机森林分类器的代码。
数据用途概述:
该数据集适用于数据科学教学、游戏分类研究、游戏机制分析等多种场景。研究人员可以利用此数据集比较不同年份的机制分类系统的分类能力;游戏设计师可以使用该数据集分析游戏机制对排名的影响;教育者可以利用此数据集进行数据科学课程的教学。此外,该数据集还适用于探索重新实现的游戏是否通常排名高于其原始游戏的研究。