-
A_destructive_active_defense_algorithm_深度伪造人脸图像主动防御算法数据
2025年12月28日 30 155 17
数据集概述 本数据集围绕深度伪造人脸图像的破坏性主动防御算法展开,包含4个压缩文件,主要涉及StarGAN系列模型及DADFI相关内容,可用于研究深度伪造人脸图像的主动防御技术。 文件详解 StarGAN−v2.zip 文件格式:ZIP 字段映射介绍:未提供具体字段信息,推测为StarGAN-v2模型相关的文件包 StarGAN-Sac.zip...
-
AI中相关推理模式的运行时监控_行为检测与SCAB协议集成
2025年12月5日 30 98 82
数据集概述 本数据集为一篇学术论文,聚焦AI运行时监控技术,探讨如何通过集成行为检测与SCAB协议,识别AI的伦理、情感及推理偏差,构建统一行为安全架构,为AI安全、政策设计提供参考。 文件详解 数据集包含一个PDF格式的学术文档,具体说明如下: - 文件名称: Academic Runtime Monitoring SCAB.pdf - 文件格式:...
-
缓解流氓AI行为_检测_控制与遏制技术
2025年12月4日 30 192 76
数据集概述 本数据集是一篇学术论文,聚焦AI系统自主性提升背景下的“流氓行为”(显著偏离人类对齐目标)问题,综述并整合了当代检测、缓解和遏制流氓AI的方法,提出统一技术分类框架,为高风险场景下AI安全的落地提供理论与实践支撑。 文件详解 文件名称: Academic Paper Mitigation Rogue AI.pdf 文件格式: PDF...
-
AI辩论数据集
2025年4月15日 30 179 141
AI辩论数据集 数据来源:互联网公开数据 标签:AI安全,辩论,人工智能,技术伦理,研究项目,数据集 数据概述: 本数据集是关于通过辩论探索AI安全性的研究项目的一部分。数据集包含了用于研究AI安全性的辩论记录及相关信息,旨在为AI安全领域的研究提供数据支持。 数据用途概述:...



