用户行为内容推荐数据集UserBehaviorContentRecommendationDataset-g0ohard
数据来源:互联网公开数据
标签:用户行为, 推荐系统, 内容推荐, 评分数据, 收藏数据, 观看时长, 行为分析, 数据挖掘
数据概述:
该数据集包含用户在内容推荐平台上的交互行为数据,记录了用户对内容的评分、收藏、观看时长等信息,主要用于构建和评估推荐系统。主要特征如下:
时间跨度:数据未明确具体时间范围,但包含时间戳(ts)字段,可以用于分析用户行为的时间序列特征。
地理范围:数据未限定地理范围,可视为全球用户行为数据。
数据维度:数据集包含多个关键维度,包括:
user_uid:用户唯一标识符;
element_uid:内容(如视频、文章等)的唯一标识符;
rating:用户对内容的评分(可能存在);
ts:时间戳,记录用户行为发生的时间;
consumption_mode:观看模式(如在线观看、离线下载等);
watched_time:观看时长;
device_type:设备类型;
device_manufacturer:设备制造商。
数据格式:数据以CSV和JSON格式提供。CSV文件包括bookmarks.csv(收藏记录)、ratings.csv(评分记录)、transactions.csv(交易记录,包含观看时长等信息)。 catalogue.json文件包含内容元数据。
来源信息:数据集来源于内容推荐平台用户行为数据,已进行匿名化处理。
该数据集适合用于推荐系统、用户行为分析、数据挖掘等领域的研究与应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于推荐算法研究、用户行为分析、个性化推荐策略优化等学术研究,如基于内容的推荐、协同过滤推荐、混合推荐等。
行业应用:为内容平台、电商平台等提供数据支持,用于构建个性化推荐系统、提升用户粘性和内容曝光率,如视频推荐、商品推荐等。
决策支持:支持平台决策者了解用户偏好、优化内容策略、提升用户体验。
教育和培训:作为推荐系统、数据挖掘、机器学习等课程的实训数据,帮助学生和研究人员实践推荐算法、理解用户行为模式。
此数据集特别适合用于探索用户在内容平台上的交互行为规律,构建和评估推荐模型,提升推荐系统的精准度和用户满意度。