IMDB电影评分与基本信息数据集2023年2月25日-mustafaoz158

IMDB电影评分与基本信息数据集2023年2月25日-mustafaoz158 数据来源:互联网公开数据 标签:IMDB,电影,评分,基本信息,数据,电影排名,用户评价

数据概述: 本数据集来源于IMDB,包含电影的基本信息及评分数据。数据集分为两个主要部分:title_basics(电影基本信息)和title_ratings(电影评分)。通过合并整理,创建了仅包含电影数据的movie_rank数据集,便于用户快速查找和分析电影的基本信息及评分情况。

数据集包含以下字段:

title_basics: - tconst (字符串) - 电影的唯一标识符 - titleType (字符串) - 电影类型(如电影、短片、电视剧等) - primaryTitle (字符串) - 流行标题/发行时的宣传标题 - originalTitle (字符串) - 原始标题,原始语言 - isAdult (布尔值) - 0:非成人内容;1:成人内容 - startYear (YYYY) - 电影的发布年份;对于电视剧,为系列开始年份 - endYear (YYYY) - 电视剧的结束年份;其他类型为'\N' - runtimeMinutes - 电影的主要时长,单位为分钟 - genres (字符串数组) - 最多包含三个与电影相关的流派

title_ratings: - tconst (字符串) - 电影的唯一标识符 - averageRating - 用户评分的加权平均值 - numVotes - 电影收到的投票数

数据集以gzip压缩的TSV格式保存,UTF-8编码,第一行为字段名,'\N'表示字段缺失或为空。

数据用途概述: 该数据集适用于电影研究、数据分析、用户推荐系统开发等多种场景。研究者可以利用此数据探索电影类型、评分趋势、观众偏好等;开发人员可以基于数据构建电影推荐系统;电影制作人和制片公司亦可参考数据进行市场分析和策略制定。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 257.53 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。