热门电视剧评分数据集-2023年-shreyajii
数据来源:互联网公开数据
标签:电视剧,评分,流行文化,数据集,推荐系统,数据分析,电影数据库,API
数据概述:
本数据集来源于电影数据库(TMDb)API,包含2098部高评分电视剧的信息。数据集通过API接口筛选出评分最高且投票数超过200次的电视剧,共分109页。数据集字段包括电视剧的唯一标识符、名称、平均评分、投票总数、首播日期、原始语言、类型ID、简介、流行度分数以及海报图片的URL路径。
数据用途概述:
该数据集适用于多种应用场景,包括数据分析、推荐系统构建、流行电视内容研究等。研究人员可以利用此数据集分析高评分电视剧的趋势;网站或应用程序开发者可以利用该数据集为用户提供个性化的电视剧推荐;教育者可以利用数据集进行影视文化研究;此外,数据集还可以用于机器学习模型的训练,预测电视剧的受欢迎程度。
数据集字段定义:
- id: 电视剧的唯一标识符
- name: 电视剧的名称
- vote_average: 用户给出的平均评分
- vote_count: 总投票数
- first_air_date: 首播日期
- original_language: 原始制作语言
- genre_ids: 类型ID列表
- overview: 电视剧简介
- popularity: 基于观众互动的流行度评分
- poster_path: 海报图片的URL路径
API访问示例(Python):
python
import requests
api_key = 'YOUR_API_KEY_HERE'
url = "https://api.themoviedb.org/3/discover/tv"
params = {
'api_key': api_key,
'include_adult': 'false',
'language': 'en-US',
'page': 1,
'sort_by': 'vote_average.desc',
'vote_count.gte': 200
}
response = requests.get(url, params=params)
data = response.json()
显示第一个电视剧
print(data['results'][0])
数据导出与分享(Google Colab示例):
python
import pandas as pd
将API数据转换为DataFrame
df = pd.DataFrame(data['results'])
保存为CSV并上传到Google Drive
from google.colab import drive
drive.mount('/content/drive')
df.to_csv('/content/drive/MyDrive/top_rated_tv_shows.csv', index=False)
分享数据集的方式:
- Google Drive:上传并分享公开链接
- Kaggle:创建公共数据集以供协作
- GitHub:将CSV文件托管在仓库中以便分享