IMDB电影评分与基本信息数据集2023年2月25日-mustafaoz158
数据来源:互联网公开数据
标签:IMDB,电影,评分,基本信息,数据,电影排名,用户评价
数据概述:
本数据集来源于IMDB,包含电影的基本信息及评分数据。数据集分为两个主要部分:title_basics(电影基本信息)和title_ratings(电影评分)。通过合并整理,创建了仅包含电影数据的movie_rank数据集,便于用户快速查找和分析电影的基本信息及评分情况。
数据集包含以下字段:
title_basics:
- tconst (字符串) - 电影的唯一标识符
- titleType (字符串) - 电影类型(如电影、短片、电视剧等)
- primaryTitle (字符串) - 流行标题/发行时的宣传标题
- originalTitle (字符串) - 原始标题,原始语言
- isAdult (布尔值) - 0:非成人内容;1:成人内容
- startYear (YYYY) - 电影的发布年份;对于电视剧,为系列开始年份
- endYear (YYYY) - 电视剧的结束年份;其他类型为'\N'
- runtimeMinutes - 电影的主要时长,单位为分钟
- genres (字符串数组) - 最多包含三个与电影相关的流派
title_ratings:
- tconst (字符串) - 电影的唯一标识符
- averageRating - 用户评分的加权平均值
- numVotes - 电影收到的投票数
数据集以gzip压缩的TSV格式保存,UTF-8编码,第一行为字段名,'\N'表示字段缺失或为空。
数据用途概述:
该数据集适用于电影研究、数据分析、用户推荐系统开发等多种场景。研究者可以利用此数据探索电影类型、评分趋势、观众偏好等;开发人员可以基于数据构建电影推荐系统;电影制作人和制片公司亦可参考数据进行市场分析和策略制定。