MovieLens2700万电影评分数据集-pa13lito
数据来源:互联网公开数据
标签:电影,评分,用户行为,推荐系统,电影数据,影评,标签,时间序列
数据概述:
本数据集是MovieLens项目提供的2700万电影评分数据集,包含2700万条用户对电影的评分记录,以及1486万条用户为电影添加的标签。数据集涵盖了58098部电影,由283228位用户贡献。
数据集包含六个CSV文件:
-
tag.csv:包含用户为电影添加的标签信息,字段包括:
- userId:用户ID
- movieId:电影ID
- tag:用户添加的标签
- timestamp:标签添加时间戳
-
rating.csv:包含用户对电影的评分信息,字段包括:
- userId:用户ID
- movieId:电影ID
- rating:用户评分
- timestamp:评分时间戳
-
movie.csv:包含电影的基本信息,字段包括:
- movieId:电影ID
- title:电影标题
- genres:电影所属的流派
-
link.csv:包含电影的外部链接标识符,用于与其他资源关联,字段包括:
- movieId:电影ID
- imdbId:IMDB电影ID
- tmdbId:TMDB电影ID
-
genome_scores.csv:包含电影与标签的相关性数据,字段包括:
- movieId:电影ID
- tagId:标签ID
- relevance:电影与标签的相关性
-
genome_tags.csv:包含标签的描述信息,字段包括:
数据用途概述:
该数据集广泛应用于电影推荐系统、用户行为分析、电影流行趋势研究等领域。研究人员可以利用此数据构建和评估推荐算法,分析用户偏好,预测电影票房,以及探索电影标签与评分之间的关系。此外,该数据集也常用于机器学习模型的训练和测试,为电影相关的研究和应用提供了重要的基础数据。