-
aspear_Source_SaferDecoding大语言模型对抗性提示防御微调数据集
2026年1月13日 30 134 76
数据集概述 本数据集用于微调模型以防御jailbreak攻击,是SafeDecoding的扩展。包含252条人类生成的原始对抗性种子提示(覆盖18个有害类别),以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对这些提示生成的拒绝请求的响应数据。 文件详解 文件名称:finetune.json 文件格式:JSON...
-
网络评论有害内容识别数据集UnzippedToxicCommentsDataset-mahmoudelkarargy1
2025年5月28日 30 31 17
网络评论有害内容识别数据集UnzippedToxicCommentsDataset-mahmoudelkarargy1 数据来源:互联网公开数据 标签:网络评论,有害内容,数据集,文本分类,机器学习,自然语言处理,情感分析,数据挖掘 数据概述:...
-
斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras
2025年4月25日 30 143 25
斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras 数据来源:互联网公开数据 标签:文本分析,有害内容,数据集,自然语言处理,机器学习,情感分析,多语言,斯拉夫语言 数据概述:...
-
多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd
2025年4月22日 30 28 26
多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd 数据来源:互联网公开数据 标签:自然语言处理,有害内容,数据集,机器学习,情感分析,文本分类,多标签分类,语言处理 数据概述:...



