MovieLens百万电影评分数据集-用户-电影与评分-2000年-samiravaez
数据来源:互联网公开数据
标签:电影,评分,推荐系统,用户行为,数据分析,机器学习,影评,娱乐
数据概述:
本数据集为MovieLens百万数据集,由GroupLens研究小组提供,是推荐系统领域内广泛使用的数据集。数据集包含6,040位用户对3,706部电影的1,000,209条评分记录。尽管数据集总共有3859部电影记录,但每个用户至少对20部电影进行了评分,评分范围为1到5分。为了丰富数据集,我们利用OMDB API(https://www.omdbapi.com/)和imdb python包,补充了关于电影的额外信息,如电影的地理来源、制片公司、时长等。电影的地理来源信息基于六大洲进行划分:非洲、亚洲、欧洲、北美洲、大洋洲和南美洲。此外,我们还对电影名称进行了编辑,以纠正拼写错误。
数据用途概述:
该数据集适用于多种推荐系统相关研究与应用,包括用户偏好分析、电影推荐算法开发、推荐系统公平性研究等。研究人员可以利用该数据分析用户评分模式,构建个性化推荐模型;还可以探索不同电影制片公司或地理位置的电影在用户评价中的表现差异,从而研究推荐系统中的偏见和不公平性。此外,该数据集也可用于教育和培训,帮助学习者理解推荐系统的基本原理和数据处理方法。