AMaze完全离散训练与迷宫分布数据集

数据集概述

该数据集包含AMaze项目中完全离散训练的所有成果,涵盖三种训练机制(直接、支架、交互式)和两种算法(A2C、PPO)的模型、曲线及可视化文件,以及用于验证泛化能力的原始数据和迷宫分布样本。

文件详解

  • 压缩包文件:
  • all_results_raw.tar.gz:.gz格式,包含训练原始结果
  • final_behavior.tar.gz:.gz格式,提供各重复实验最终行为的可视化
  • 数据文件:
  • mazes_distributions_1000_seeds.csv:CSV格式,包含1000个种子生成的迷宫分布数据,字段包括名称、尺寸、路径、线索、陷阱等属性
  • aggregated_dynamics.csv:CSV格式,包含聚合的运行动态数据,字段包括算法、训练器、步数、平均奖励、错误类型等
  • 文档与图像文件:
  • mazes_distributions_1000_seeds.pdf:PDF格式,迷宫分布概述图表
  • aggregated_dynamics.pdf:PDF格式,运行动态聚合结果图表
  • all_discrete_inputs.png:PNG格式,离散输入概览图像
  • 代码文件:
  • dynamics_aggregator.py:Python格式,用于聚合运行动态的脚本

适用场景

  • 强化学习算法研究:分析A2C与PPO算法在离散训练机制下的性能差异
  • 迷宫环境泛化能力评估:基于迷宫分布数据验证模型在不同复杂度迷宫中的适应性
  • 训练动态分析:通过聚合数据探究训练过程中奖励、错误率等指标的变化规律
  • 可视化研究:利用行为可视化文件分析智能体在迷宫任务中的行为模式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 542.96 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。