YIFY电影元数据与关键词数据集-电影信息与推荐系统研究-2018年3月
数据来源:互联网公开数据
标签:电影,元数据,关键词,YIFY,TMDB,IMDB,推荐系统,电影数据库,电影分析
数据概述:
本数据集包含了截至2018年3月在YIFY电影网站上发布的所有电影的元数据,数据主要来源于TMDB(The Movie Database)。数据集涵盖了大约11000部电影的信息,包括电影的剧情关键词、预算、票房收入、海报、上映日期、语言、制作公司、国家/地区、TMDB评分计数和平均评分等。此外,数据集还包含IMDB(互联网电影数据库)的电影代码。
数据集主要由以下几个文件组成:
movies_metadata.csv:主文件,包含电影的元数据,包括类型、语言、系列、海报、背景、预算、票房、上映日期、制作国家和公司等25个字段。
keywords.csv:包含电影的剧情关键词。
IMDB_codes.txt:包含所有电影的IMDB代码。
TMDB_id.txt:包含电影的TMDB代码。
数据用途概述:
该数据集适用于电影分析、电影推荐系统开发等多种场景。研究人员可以利用此数据进行电影票房预测、类型分析、电影关联性分析等研究;开发者可以基于此数据构建电影推荐系统,为用户提供个性化的电影推荐服务。此外,数据集也适合用于机器学习模型的训练,例如用于预测电影受欢迎程度或用户评分。