电影数据集-电影元数据与用户评分2017-sezginildes

电影数据集-电影元数据与用户评分2017-sezginildes 数据来源:互联网公开数据 标签:电影元数据,用户评分,电影推荐,电影分析,电影制作,电影产业,电影评价,电影产业研究

数据概述: 本数据集包含45,000部电影的元数据,这些电影收录于完整的MovieLens数据集中,发行日期不晚于2017年7月。数据集包括电影的演职人员信息、剧情关键词、预算、票房收入、海报、上映日期、语言、制作公司和国家等详细信息。此外,该数据集还包含2600万个用户对这45,000部电影的评分记录,评分来自270,000名用户,评分范围为1到5分。

数据集主要由以下文件组成:

movies_metadata.csv:主要的电影元数据文件,包含45,000部电影的信息,如海报、背景图片、预算、票房收入、上映日期、语言、制作国家和公司等。

keywords.csv:包含MovieLens电影的剧情关键词,以字符串化的JSON对象形式提供。

credits.csv:包含所有电影的演职人员信息,包括演员和剧组成员,以字符串化的JSON对象形式提供。

links.csv:包含完整MovieLens数据集中所有电影的TMDB(The Movie Database)和IMDB(Internet Movie Database)ID。

links_small.csv:包含9,000部电影的TMDB和IMDB ID,这些电影为完整数据集的一部分。

ratings_small.csv:包含700名用户对9,000部电影的100,000条评分记录。

数据用途概述: 该数据集适用于多种电影分析和研究场景,包括电影产业研究、电影推荐系统开发、电影成功预测等。研究人员可以使用此数据集进行电影产业历史和趋势分析,预测电影的票房收入和受欢迎程度;教育机构可以利用此数据集进行电影分析课程的教学;开发人员可以基于此数据集构建内容推荐和协同过滤推荐系统,为用户提供个性化的电影推荐。此外,数据集还适用于电影评价趋势分析和电影制作策略评估等方面的研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 14.58 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。