MovieLens电影元数据与用户行为分析数据集1995-2023
数据来源:互联网公开数据
标签:电影,推荐系统,用户行为,评分,标签,元数据,电影信息,TMDB,影评分析
数据概述:
本数据集包含MovieLens提供的电影元数据及用户行为数据,涵盖了1995年1月9日至2023年7月20日期间,超过33万用户对8.6万部电影的约3300万条评分记录,以及200万条标签应用数据。此外,还包括1400万条关于1100个标签的关联度评分数据。数据集来源于TMDB,包含了电影的预算、票房收入、上映日期、类型等详细元数据信息。
数据包括:
movies_metadata.csv:包含来自TMDB的86000多部电影的元数据,数据包括预算、收入、上映日期、类型等。
credits.csv:包含关于特定电影的完整演职员信息,数据包括导演、制片人、演员、角色等。
keywords.csv:包含与电影相关的剧情关键词。
数据用途概述:
该数据集广泛应用于电影推荐系统开发、用户行为分析、电影票房预测、电影类型分析等领域。研究人员可以利用该数据构建个性化推荐模型,分析用户对不同电影类型的偏好,研究电影的票房影响因素,以及进行电影评论的情感分析等。此外,该数据集也适合用于机器学习模型的训练和评估,以及电影行业的市场研究和商业决策。