找到137个数据集

标签: 强化学习

过滤结果
  • Kaggle-ConnectX决赛智能体对局数据集2023

    2025年4月15日   

    Kaggle-ConnectX决赛智能体对局数据集2023 数据来源:互联网公开数据 本数据集来自 Kaggle 平台举办的 ConnectX 强化学习竞赛,收集了公开排行榜(Public Leaderboard)前 50 名智能体在比赛中进行的对局信息。原始对局以 JSON 格式保存,同时提取了所有对局中的动作与状态,共包含: 6367...
    packageimg
  • 英特尔历史股票价格数据集

    2025年4月15日   

    英特尔历史股票价格数据集 数据来源:互联网公开数据 标签:英特尔,股票价格,历史数据,时间序列,金融分析,深度强化学习,算法测试 数据概述: 本数据集收录了2016年2月17日至2024年5月7日期间英特尔的历史股票价格信息。数据集通过yfinance(雅虎财经Python...
    packageimg
  • 石头剪刀布智能体对战数据集

    2025年4月15日   

    石头剪刀布智能体对战数据集 数据来源:互联网公开数据 标签:石头剪刀布,策略分析,博弈论,人工智能,游戏对战,随机策略,纳什均衡 数据概述 本数据集包含石头剪刀布(Rock Paper...
    packageimg
  • 数据6G车联网动态网络切片与资源分配数据集1963-2021

    2025年4月15日   

    数据6G车联网动态网络切片与资源分配数据集1963-2021 数据来源:互联网公开数据 标签:6G网络,车联网,动态网络切片,资源分配,强化学习,边缘计算,物联网 数据概述:...
    packageimg
  • ABBIRB120机器人逆运动学数据集

    2025年4月15日   

    ABBIRB120机器人逆运动学数据集 数据来源:互联网公开数据 标签:机器人学,逆运动学,直接运动学,IRB 120,数据集,机械臂,多层感知器,遗传编程 数据概述: 本数据集包含了ABB IRB...
    packageimg
  • 国际象棋四连珠游戏结果数据集1963-2021

    2025年4月15日   

    国际象棋四连珠游戏结果数据集1963-2021 数据来源:互联网公开数据 标签:国际象棋四连珠,游戏结果,神经网络,机器学习,人工智能,训练数据 数据概述:...
    packageimg
  • 大型语言模型LLM科学考试RLHF训练数据集

    2025年4月15日   

    大型语言模型LLM科学考试RLHF训练数据集 数据来源:互联网公开数据 标签:LLM, 科学考试, RLHF, 奖励模型训练, 强化学习, 自然语言处理, 机器学习 数据概述: 本数据集是使用Llama-2-13b模型生成的,专门用于奖励模型(RM, Reward Model)训练,进而应用于强化学习与人类反馈(RLHF, Reinforcement...
    packageimg
  • 卡鲁阿纳国际象棋对局数据集2021-2023

    2025年4月14日   

    卡鲁阿纳国际象棋对局数据集2021-2023 数据来源:互联网公开数据 标签:卡鲁阿纳,国际象棋,对局数据,象棋赛事,对局分析,棋手评价,比赛结果 数据概述:...
    packageimg
  • UR3模仿学习轨迹数据集

    2025年4月14日   

    UR3模仿学习轨迹数据集 数据来源:互联网公开数据 标签:UR3机器人,模仿学习,轨迹数据,机器人运动规划,控制算法,CSV文件,关节位置,工具位置 数据概述:...
    packageimg
  • 井字棋合成数据集

    2025年4月14日   

    井字棋合成数据集 数据来源:互联网公开数据 标签:井字棋,神经网络,机器学习,合成数据,最优策略,游戏AI,算法优化 数据概述:...
    packageimg
  • 宝可梦GO游戏宝可梦属性及招式数据集-实时更新

    2025年4月14日   

    宝可梦GO游戏宝可梦属性及招式数据集-实时更新 数据来源:互联网公开数据 标签:宝可梦,Pokemon,宝可梦GO,游戏数据,属性,招式,PVP,对战,实时更新 数据概述:...
    packageimg
  • ABBIRB2400六自由度人形机器人逆运动学数据集1963-2021

    2025年4月14日   

    ABBIRB2400六自由度人形机器人逆运动学数据集1963-2021 数据来源:互联网公开数据 标签:机器人,逆运动学,六自由度,人形机器人,ABB IRB2400,机器学习,训练数据,工业自动化 数据概述: 本数据集来源于基于Denavit-Hartenberg正运动学计算的结果,适用于六自由度人形机器人ABB...
    packageimg
  • 动态3D环境中的机器人导航数据集

    2025年4月14日   

    动态3D环境中的机器人导航数据集 数据来源:互联网公开数据 标签:机器人导航,动态环境,路径规划,避障算法,3D模拟,自动化系统,能量效率 数据概述: 本数据集旨在优化机器人在动态3D环境中的路径规划算法。数据集包含机器人在实时场景中遇到静态和动态障碍物时生成的数据,涵盖了起始点和目标点的坐标(X, Y,...
    packageimg
  • 壳牌黑客松电动汽车基础设施研究数据集2010-2016

    2025年4月14日   

    壳牌黑客松电动汽车基础设施研究数据集2010-2016 数据来源:互联网公开数据 标签:电动汽车,基础设施,时间序列,预测分析,ARIMA,机器学习,Shell黑客松 数据概述:...
    packageimg
  • 数据6G车辆无线网络调度数据集

    2025年4月14日   

    数据6G车辆无线网络调度数据集 数据来源:互联网公开数据 标签:6G,车辆网络,网络调度,人工智能,资源分配,网络效率,车辆移动,网络切片,通信模式,性能指标,深度强化学习,遗传算法,实时调度,高密度车辆网络 数据概述:...
    packageimg
  • TicTacToe Q 学习表数据集

    2024年11月9日   

    这是一个 json 文件,包含井字游戏的所有 5890 个有效配置。最初应该有 19,683 个配置,但在删除所有不可能的组合后,我们只剩下这个数字 5890这个数据集的独特之处在于它不知道 AI 扮演什么位置。但建议让 AI(代理)扮演 X(第一步),以便让它领先一步。显然,如果你想让代理在学会扮演 X 之后扮演 O,你需要另一个相同的 q...
    packageimg
  • AI 传感器的高级信号处理数据集

    2024年11月8日   

    该数据集由Emirhan Bulut ( kaggle.com/emirhanai ) 创建 高分辨率信号数据:来自最先进传感器的详细读数,包括雷达、声纳和红外系统。 AI 系统输出:反映 AI 对传感器输入的处理的数据,例如目标识别和威胁评估。 操作日志:人工智能系统在各种模拟场景中的决策和行动的记录。...
    packageimg