印度电影数据库1950-2019

印度电影数据库1950-2019 数据来源:互联网公开数据 标签:印度电影,电影数据库,电影分析,机器学习,内容推荐,协同过滤,数据挖掘

数据概述: 印度电影数据库(TIMDB)是一个结构化的数据集,涵盖了1950年至2019年间发布的印度电影信息。数据库分为五个子目录,分别基于电影的年份和机器学习的应用场景,提供共计约13.7 MB的数据。数据库提供了35个独特的属性字段,涵盖电影的基本信息、元数据、评分、文本描述及制作团队信息等。数据集支持内容推荐和协同过滤等应用场景,适用于电影分析、推荐系统开发及研究领域。

数据用途概述: 该数据集适用于电影推荐系统开发、内容分析、电影趋势研究及学术研究等场景。研究者可以通过分析电影的元数据、评分和文本信息,探究电影产业的发展趋势;推荐系统开发者能够利用该数据集进行内容推荐和协同过滤;同时,该数据集也适合用于教育培训,帮助学习者了解电影产业的数据分析方法及应用。

举例: 数据库中的“bollywood.csv”文件包含了每部电影的基本信息,如标题、IMDb标识符、海报路径及维基链接等;“bollywood_meta.csv”文件则提供了电影的详细元数据,包括IMDb标识符、原始标题、是否为成人电影、上映年份、片长和类型等;“bollywood_ratings.csv”文件记录了电影的IMDb评分及其投票数;“bollywood_text.csv”文件包含了电影的故事、摘要、标语、演员列表及获奖提名等文本信息;“bollywood_crew.csv”文件则列出了所有参与电影制作的导演和编剧信息,而“bollywood_crew_data.csv”和“bollywood_writers_data.csv”文件则提供了导演和编剧的详细职业背景信息。此外,“collaborative”子目录中的数据文件为推荐系统开发者提供了电影标签、评分及用户标签等信息。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.03 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。