Movielens_20M电影评分完整数据集1995_2015

数据集概述

本数据集包含MovieLens 20M数据集中的约2000万条电影评分记录,涉及27,278部电影和138,493名用户。数据时间跨度为1995年1月9日至2015年3月31日,每条记录包含用户对电影的评分(1-5分,5分为最高)。在本研究中,仅将评分高于2分的记录视为正面评价进行分析。数据集为单一文本文件格式。

文件详解

  • 文件名称:movielens.txt
  • 文件格式:TXT
  • 字段映射介绍:文本文件包含三列数值数据,分别对应:
  • 第一列:用户ID(User ID)
  • 第二列:电影ID(Movie ID)
  • 第三列:评分值(Rating,1-5分)

数据来源

MovieLens 20M Dataset

适用场景

  • 推荐系统算法开发:用于构建和测试协同过滤、矩阵分解等电影推荐算法
  • 用户行为分析:研究用户评分模式、观影偏好和评分分布特征
  • 时序数据分析:分析20年间电影评分趋势和用户评分行为变化
  • 机器学习模型训练:为评分预测、用户画像构建等任务提供训练数据
  • 数据挖掘研究:探索用户-电影交互网络的拓扑结构和社区特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.7 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。