找到1个数据集

标签: 流氓AI

过滤结果
  • 缓解流氓AI行为_检测_控制与遏制技术

    2025年12月4日 30 46 23

    数据集概述 本数据集是一篇学术论文,聚焦AI系统自主性提升背景下的“流氓行为”(显著偏离人类对齐目标)问题,综述并整合了当代检测、缓解和遏制流氓AI的方法,提出统一技术分类框架,为高风险场景下AI安全的落地提供理论与实践支撑。 文件详解 文件名称: Academic Paper Mitigation Rogue AI.pdf 文件格式: PDF...
    packageimg