-
aspear_Source_SaferDecoding大语言模型对抗性提示防御微调数据集
2026年1月13日 30 116 46
数据集概述 本数据集用于微调模型以防御jailbreak攻击,是SafeDecoding的扩展。包含252条人类生成的原始对抗性种子提示(覆盖18个有害类别),以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对这些提示生成的拒绝请求的响应数据。 文件详解 文件名称:finetune.json 文件格式:JSON...
-
亚里士多德人类思想本质研究文献
2025年12月14日 30 99 49
数据集概述 本数据集包含一篇关于亚里士多德《论灵魂》第三卷4-8章的研究文献,聚焦人类思想本质的核心概念“努斯”(nous),通过分离主义、直接实在论、认知灵魂嵌入性及理性主义四个关键视角展开分析。 文件详解 文件名称: Corcilius, Falcon, Roreitner_Aristotle on the Essence of Human...
-
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
2025年4月24日 30 165 97
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:...



