快手随机曝光视频推荐数据集-2022年-arashnic

快手随机曝光视频推荐数据集-2022年-arashnic 数据来源:互联网公开数据 标签:推荐系统,随机曝光,视频,用户交互,数据集,机器学习,评估,偏见,序列推荐,交互推荐,多任务学习

数据概述: 本数据集包含快手平台中用户与视频之间的交互记录,特别设计用于研究推荐系统的偏见和评估推荐策略。数据集分为三个版本:KuaiRand-27K、KuaiRand-1K 和 KuaiRand-Pure。KuaiRand-27K 包含超过27,000名用户和3,200万条视频的完整记录,适用于需要大规模、完整交互记录的研究场景。KuaiRand-1K 从中随机抽取1,000名用户及其互动记录,适用于需要部分交互数据的研究。KuaiRand-Pure 则仅包含候选池中的7,583条视频的交互日志,适用于需要较小规模数据的研究。

数据集中的日志文件记录了不同推荐策略下用户的交互行为,包括随机干预和标准推荐两种策略。交互记录包含了详细的用户ID、时间戳、视频特征、用户行为信号(如点击、点赞、观看时长等),为推荐系统的研究提供了丰富的背景信息。

数据用途概述: 该数据集适用于推荐系统中的多种研究方向,包括但不限于: - 离策略评估(OPE):评估推荐策略在不同环境下的表现。 - 交互推荐:研究用户与推荐系统之间的动态交互过程。 - 长序列行为建模:分析用户的长期交互行为模式。 - 多任务学习:在推荐系统中同时处理多种任务。

数据集通过在标准推荐流中插入随机暴露的视频,提供了真实且无偏的数据样本,有助于研究者开发和评估能够减少推荐系统偏见的算法。此外,数据集还支持多种推荐研究方向,为研究人员提供了丰富的数据资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 47.28 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。