找到3个数据集

标签: 奖励值

过滤结果
  • IMP_MARL_Based多智能体强化学习环境实验数据集

    2026年1月30日 30 158 6

    数据集概述 本数据集为IMP-MARL多智能体强化学习实验数据集,包含三种环境(struct_uc、struct_c、owf)下七种MARL方法的实验日志、最优智能体网络权重及启发式策略日志。数据支持多智能体强化学习算法性能评估与对比分析,共包含四个文件,以压缩包和文档为主。 文件详解 MARL_logs.zip 文件格式:ZIP...
    packageimg
  • Seinstra_data_Based_人类跨期决策贴现率与速率最大化研究数据

    2026年1月20日 30 49 36

    数据集概述 本数据集聚焦人类经验性跨期决策行为,探究贴现率与速率最大化两大理论在解释决策机制中的作用。通过81名被试的行为实验数据,对比分析了双曲线贴现模型与速率最大化规则对不同实验条件下选择数据的拟合效果,为跨期决策理论的整合提供实证支持,共包含1个数据文件。 文件详解 文件名称:Seinstra_data.xlsx 文件格式:XLSX...
    packageimg
  • 强化学习训练历史数据分析数据集ReinforcementLearningTrainingHistoryData-marselolopez

    2025年4月29日 30 126 34

    强化学习训练历史数据分析数据集ReinforcementLearningTrainingHistoryData-marselolopez 数据来源:互联网公开数据 标签:强化学习, 训练过程, 梯度范数, TD损失, 奖励值, 历史数据, 算法分析, 数据可视化 数据概述:...
    packageimg