搜狐推荐系统用户行为数据集

搜狐推荐系统用户行为数据集_Sohu_Recommendation_System_User_Behavior_Dataset

数据来源:互联网公开数据

标签:推荐系统, 用户行为, 点击日志, 行为分析, 数据挖掘, 机器学习, 互联网, 数据集

数据概述: 该数据集包含来自搜狐(Sohu)推荐系统收集的用户行为数据,记录了用户在特定时间段内的浏览、点击等交互行为。主要特征如下: 时间跨度:数据记录的时间范围为2022年,具体起止时间未知。 地理范围:数据可能覆盖中国大陆地区,根据“province”(省份)和“city”(城市)字段推断。 数据维度:数据集包括多个关键字段,如“testSampleId”(测试样本ID)、“pvId”(页面访问ID)、“suv”(用户唯一标识)、“itemId”(推荐内容ID)、“userSeq”(用户行为序列)、“logTs”(日志时间戳)、“operator”(运营商)、“browserType”(浏览器类型)、“deviceType”(设备类型)、“osType”(操作系统类型)、“province”(省份)、“city”(城市)。 数据格式:数据以CSV格式提供,包含train-dataset.csv和test-dataset.csv两个文件,方便数据分析和建模。原始数据经过了脱敏处理,以保护用户隐私。 数据来源:数据可能来源于搜狐新闻客户端或其他搜狐旗下产品。该数据集适合用于推荐系统算法的训练与评估。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于推荐系统、用户行为分析、数据挖掘等领域的研究,例如用户兴趣建模、点击率预测、个性化推荐算法研究等。 行业应用:可以为互联网行业提供数据支持,特别是在新闻资讯、内容推荐、广告投放等领域。 决策支持:支持产品优化、用户体验提升和商业策略制定,例如改进推荐算法、优化内容推荐策略等。 教育和培训:作为数据科学、机器学习、推荐系统等课程的教学案例,帮助学生和研究人员理解用户行为和推荐系统的工作原理。 此数据集特别适合用于探索用户在新闻资讯平台上的行为模式,预测用户对内容的兴趣,并优化推荐系统的性能,从而提升用户体验和平台效益。

packageimg

数据与资源

附加信息

字段
版本 1
数据集大小 418.95 MiB
最后更新 2025年11月22日
创建于 2025年11月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。