电影评分数据集-2011至2021年-soundslikedata
数据来源:互联网公开数据
标签:电影,评分,流行度,类型,语言,发布日期,用户评价,数据集,电影推荐,数据分析
数据概述:
本数据集包含了2011年至2021年间电影的相关信息,包括电影的类型、原始语言、原始标题、流行度、上映日期、中文标题、平均评分和评分次数。数据集来源于The Movie Database (TMDb),涵盖了多种类型的电影,并标注了详细的类型代码和语言代码。类型代码对应不同的电影类型,语言代码则表示电影的原始语言。
字段定义:
genre_ids:电影所属类型的代码列表(例如,[28, 35, 878] 表示动作、喜剧和科幻)。
original_language:电影的原始语言代码(例如,'en' 表示英语)。
original_title:电影的原始标题。
popularity:电影的流行度指标,通常基于用户评分或观看次数(数值越高表示越流行)。
release_date:电影的上映日期(格式为YYYY-MM-DD)。
title:电影的中文标题,可能与原始标题不同。
vote_average:电影的平均评分,通常在1到10之间的评分(数值越高表示评分越高)。
vote_count:电影收到的总评分次数。
类型代码:
动作 - 28
动作与冒险 - 10759
冒险 - 12
动画 - 16
喜剧 - 35
犯罪 - 80
纪录片 - 99
剧情 - 18
家庭 - 10751
奇幻 - 14
历史 - 36
恐怖 - 27
儿童 - 10762
音乐 - 10402
悬疑 - 9648
新闻 - 10763
真人秀 - 10764
科幻与奇幻 - 10765
肥皂剧 - 10766
脱口秀 - 10767
惊悚 - 53
电视电影 - 10770
战争 - 10752
战争与政治 - 10768
西部 - 37
爱情 - 10749
语言代码:
英语 - en
韩语 - ko
葡萄牙语 - pt
印地语 - hi
普通话 - cn
西班牙语 - es
瑞典语 - sv
泰语 - th
简体中文 - zh
土耳其语 - tr
法语 - fr
日语 - ja
波兰语 - pl
菲律宾语(他加禄语) - tl
印尼语 - id
德语 - de
罗马尼亚语 - ro
孟加拉语 - bn
意大利语 - it
挪威语 - no
泰卢固语 - te
泰米尔语 - ta
俄语 - ru
拉脱维亚语 - lv
乌克兰语 - uk
希伯来语 - he
希腊语 - el
阿尔巴尼亚语 - sq
塞尔维亚语 - sr
芬兰语 - fi
越南语 - vi
荷兰语 - nl
捷克语 - cs
格鲁吉亚语 - ka
阿拉伯语 - ar
丹麦语 - da
蒙古语 - mn
立陶宛语 - lt
卡纳达语 - kn
波斯语(法arsi) - fa
克罗地亚语 - hr
加泰罗尼亚语 - ca
冰岛语 - is
马其顿语 - mk
马拉雅拉姆语 - ml
加利西亚语 - gl
约鲁巴语 - yo
旁遮普语 - pa
斯洛伐克语 - sk
未知 - xx
马来语 - ms
毛利语 - mi
塞尔波克罗地亚语 - sh
僧伽罗语 - si
爱沙尼亚语 - et
爪哇语 - jv
巴斯克语 - eu
爱尔兰语 - ga
匈牙利语 - hu
乌尔都语 - ur
库尔德语 - ku
马拉地语 - mr
藏语 - bo
数据用途概述:
该数据集适用于电影推荐系统、电影数据分析、用户偏好研究、电影产业分析等多种场景。研究者可以利用此数据集进行电影类型和语言分布的分析;电影制片公司可以据此了解不同类型的电影在不同语言市场的受欢迎程度;电影评论网站可以使用此数据集进行内容推荐和评分统计。此外,该数据集也适合用于教育培训,帮助学习者掌握电影数据分析的基本方法。