烂番茄顶级电影评分和技术数据集
数据来源:互联网公开数据
标签:电影评分,观众评价,评论分析,影视行业,观影趋势,票房数据,导演信息,制作技术,电影分类
数据概述
本数据集收录了烂番茄平台上900多部顶级电影的详细信息,包括影评人和观众的评分、票房数据、制作团队、上映日期、时长等技术性信息。每部电影的数据字段涵盖了电影名称、年份、概述、评分(影评人评分与观众评分)、共识性评论、评论总数、评分总数、类型、流派、语言、导演、制片人、编剧、影院上映日期、流媒体上映日期、美国票房总收入、片长、制作公司、声音混音格式、画面长宽比等。数据集提供了全面的电影信息,为研究电影行业趋势、制作技巧、观众偏好等提供了丰富的数据支持。
数据用途概述
该数据集适用于多种场景:
1. 电影推荐系统:利用影评人和观众评分,开发电影推荐应用,为用户提供个性化的观影建议。
2. 影视行业研究:通过对影评人评分、观众评分、票房收入、上映年份等数据的分析,探索电影行业的变化趋势,识别高票房电影的共性特征。
3. 评论情感分析:基于影评人评论,进行情感分析,识别不同流派电影在影评人中的情感倾向,为电影制作和营销提供参考。
4. 教育与培训:数据集可用于影视行业相关的教育课程,帮助学习者理解电影制作、评论分析和市场表现之间的关系。
5. 行业比较分析:通过对比不同类型的电影(如动作片、喜剧片、科幻片等),分析不同流派电影在票房、评分和评论上的表现差异。
举例说明
字段定义如下:
- title:电影名称(字符串类型),例如“阿凡达”、“泰坦尼克号”。
- year:电影上映年份(整数类型),例如“2009”、“1997”。
- synopsis:电影概述(字符串类型),简要介绍电影的主要情节或主题。
- critic_score:影评人评分(整数类型),满分100分,例如“92”、“88”。
- people_score:观众评分(整数类型),满分100分,例如“87”、“91”。
- consensus:影评人对电影的共识性评论(字符串类型),简要总结电影的优缺点。
- total_reviews:影评人评论总数(整数类型),例如“1200”、“850”。
- total_ratings:观众评分总数(整数类型),例如“50000”、“65000”。
- type:电影类型(字符串类型),例如“剧情片”、“纪录片”。
- genre:电影流派(字符串类型),例如“动作片”、“喜剧片”。
- original_language:电影原始语言(字符串类型),例如“英语”、“西班牙语”。
- director:电影导演(字符串类型),例如“詹姆斯·卡梅隆”、“克里斯托弗·诺兰”。
- producer:电影制片人(字符串类型),例如“乔恩·兰道”、“大卫·埃尔利希”。
- writer:电影编剧(字符串类型),例如“詹姆斯·卡梅隆”、“弗兰克·德拉邦特”。
- release_date_(theaters):影院上映日期(日期类型),例如“2009-12-18”、“1997-12-19”。
- release_date_(streaming):流媒体上映日期(日期类型),例如“2020-03-31”、“2019-06-01”。
- box_office_(gross_usa):美国票房总收入(整数类型,单位为美元),例如“2923000000”、“659400000”。
- runtime:电影时长(整数类型,单位为分钟),例如“162”、“194”。
- production_co:电影制作公司(字符串类型),例如“二十世纪福克斯”、“派拉蒙影业”。
- sound_mix:电影的声音混音格式(字符串类型),例如“杜比全景声”、“5.1环绕声”。
- aspect_ratio:电影画面长宽比(字符串类型),例如“2.39:1”、“1.85:1”。
- view_the_collection:电影所属系列的链接(URL类型),例如“https://www.rottentomatoes.com/collections/avengers-movie-collection/”。
- crew:电影制作团队成员列表(字符串类型),包含导演、编剧、演员等信息。
数据价值
该数据集为研究电影行业的动态发展、观众偏好、影评人评价、票房表现等提供了详实的数据支持。无论是电影爱好者、影视行业从业者,还是数据分析师,都可以通过该数据集探索电影行业的多样性和复杂性,为电影创作、营销策略和行业研究提供有价值的参考。