-
aspear_Source_SaferDecoding大语言模型对抗性提示防御微调数据集
2026年1月13日 30 106 37
数据集概述 本数据集用于微调模型以防御jailbreak攻击,是SafeDecoding的扩展。包含252条人类生成的原始对抗性种子提示(覆盖18个有害类别),以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对这些提示生成的拒绝请求的响应数据。 文件详解 文件名称:finetune.json 文件格式:JSON...
-
深度学习对抗样本生成数据集DeepLearningAdversarialSampleGenerationDataset-franksalazar
2025年5月28日 30 163 83
深度学习对抗样本生成数据集DeepLearningAdversarialSampleGenerationDataset-franksalazar 数据来源:互联网公开数据 标签:对抗样本, 深度学习, 图像识别, 模型攻击, 模型防御, 机器学习, 数据集, 计算机视觉 数据概述:...



