MovieLens2700万电影评分数据集-pa13lito

MovieLens2700万电影评分数据集-pa13lito

数据来源:互联网公开数据

标签:电影,评分,用户行为,推荐系统,电影数据,影评,标签,时间序列

数据概述: 本数据集是MovieLens项目提供的2700万电影评分数据集,包含2700万条用户对电影的评分记录,以及1486万条用户为电影添加的标签。数据集涵盖了58098部电影,由283228位用户贡献。

数据集包含六个CSV文件:

  1. tag.csv:包含用户为电影添加的标签信息,字段包括:

    • userId:用户ID
    • movieId:电影ID
    • tag:用户添加的标签
    • timestamp:标签添加时间戳
  2. rating.csv:包含用户对电影的评分信息,字段包括:

    • userId:用户ID
    • movieId:电影ID
    • rating:用户评分
    • timestamp:评分时间戳
  3. movie.csv:包含电影的基本信息,字段包括:

    • movieId:电影ID
    • title:电影标题
    • genres:电影所属的流派
  4. link.csv:包含电影的外部链接标识符,用于与其他资源关联,字段包括:

    • movieId:电影ID
    • imdbId:IMDB电影ID
    • tmdbId:TMDB电影ID
  5. genome_scores.csv:包含电影与标签的相关性数据,字段包括:

    • movieId:电影ID
    • tagId:标签ID
    • relevance:电影与标签的相关性
  6. genome_tags.csv:包含标签的描述信息,字段包括:

    • tagId:标签ID
    • tag:标签描述

数据用途概述: 该数据集广泛应用于电影推荐系统、用户行为分析、电影流行趋势研究等领域。研究人员可以利用此数据构建和评估推荐算法,分析用户偏好,预测电影票房,以及探索电影标签与评分之间的关系。此外,该数据集也常用于机器学习模型的训练和测试,为电影相关的研究和应用提供了重要的基础数据。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 268.03 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。