YouTube喜剧对决用户偏好数据集-2011至2012年-uciml
数据来源:互联网公开数据
标签:YouTube,喜剧对决,用户投票,视频偏好,数据集,娱乐分析,机器学习,预测模型
数据概述:
本数据集包含了YouTube Comedy Slam实验中用户对视频趣味性投票的记录,该实验于2011年至2012年在YouTube平台上进行。在实验中,成对的视频展示给用户,用户投票选择认为更有趣的视频。数据集共记录了约170万条投票,按时间顺序排列。前80%的数据作为训练集,剩余20%作为测试集。
每行数据代表一个匿名用户的投票,包含三个以逗号分隔的字段:
- 第一个字段:视频对中的第一个YouTube视频ID
- 第二个字段:视频对中的第二个YouTube视频ID
- 第三个字段:投票结果,取值为'left'或'right'。'left'表示用户认为第一个视频更有趣,'right'表示用户认为第二个视频更有趣
数据集来源于UCI机器学习仓库:https://archive.ics.uci.edu/ml/datasets/YouTube+Comedy+Slam+Preference+Data
数据用途概述:
该数据集适用于视频趣味性预测、用户偏好分析、娱乐内容推荐等多种场景。研究人员可以利用此数据集开发和评估预测模型,帮助企业优化内容推荐策略;教育机构可用于机器学习和数据分析课程的教学;普通用户也可以通过分析这些数据了解不同视频内容的趣味性特征。此数据集为理解和预测用户对于喜剧视频的兴趣提供了有价值的数据支持。