"英文标题:Global Internet Recommender Algorithm Parameter and Effect Evaluation Database
数据集概述
覆盖互联网信息服务领域推荐算法核心参数配置与对应效果评估的关联数据。包含主流推荐算法框架下的参数取值、实验环境配置及多维度效果指标。数据按实验批次组织,覆盖不同用户群体、内容场景及算法类型,支持参数调优与效果归因分析。字段定义遵循推荐系统领域标准规范,可直接用于模型迭代与效果验证。
该数据集为推荐算法的优化迭代提供支撑,通过关联参数配置与效果表现,可揭示参数对推荐结果的影响规律。数据覆盖推荐系统全链路关键环节,包括召回、排序、重排等模块的参数,以及用户点击率、留存率、转化率等核心效果指标。适用于算法研发人员定位效果瓶颈、验证参数优化方向,为推荐系统的精准性与公平性优化提供数据基础。
字段详情
数据集包含以下核心字段:
algorithm_framework:算法框架,标识推荐算法所属技术体系,如协同过滤、深度学习排序等
parameter_group_id:参数组ID,唯一标识一组推荐算法参数配置
recall_topk:召回TopK值,指推荐系统召回阶段返回的候选内容数量
ctr:点击率,单位百分比,指用户点击推荐内容的比例
user_retention_7d:7日用户留存率,单位百分比,指点击推荐内容后7日仍活跃的用户比例
fairness_score:公平性得分,范围[0,1],用于评估推荐结果的内容多样性与用户群体公平性
适用场景
- 推荐算法研发人员进行参数调优,验证不同参数组合对推荐效果的影响
- 互联网产品经理分析推荐效果与用户行为的关联,优化产品推荐策略
- 算法伦理研究人员评估推荐系统的公平性,识别潜在的偏见问题
- 企业数据科学家构建推荐算法效果预测模型,提升优化效率
- 监管机构监测推荐算法的效果表现,评估其对用户体验的影响"