AIVillage生成对抗红队2活动数据集-2023-dreadnode

AIVillage生成对抗红队2活动数据集-2023-dreadnode 数据来源:互联网公开数据 标签:AI Village,生成对抗,红队,数据集,网络安全,机器学习,评分,样本

数据概述: 本数据集包含了2023年Defcon 32上AI Village举办的第二届生成对抗红队活动(GRT2)期间收集的所有原始数据。数据集以csv和parquet两种格式提供,方便用户使用。数据集包括以下几部分:

  1. 推理请求(grt2_inference.csv/grt2_inference.parquet)

    • 包含在GRT2活动中发送到OLMo API端点的所有推理请求,包括运行和提交中的样本以及未参与提交的请求。
    • 字段:id(请求唯一标识符)、timestamp(请求时间戳)、status_code(API响应状态码,200/400/404)、request_message(发送给OLMo模型的消息)、response_message(OLMo模型的响应)。
  2. 运行元数据(grt2_runs.csv/grt2_runs.parquet)

    • 包含用户创建的所有运行的元数据,每行代表一个唯一的运行,可能包含在提交中,也可能未包含。
    • 字段:run_id(运行唯一标识符)、user_id(创建运行的用户标识符)、commentary(用户提供的额外注释)、eval_name(用户创建运行时选择的评估类型,选项包括'privacy', 'harmful-language', 'misinformation', 'malicious-uses', 或 'custom')、submission_ids(包含该运行的提交标识符列表)、created_at(运行创建时间)、primary_scorer(主要评分者名称)、primary_score(主要评分值)、secondary_scorer(次要评分者类型,如有)、secondary_score(次要评分值,如有)。
  3. 提交记录(grt2_submissions.csv/grt2_submissions.parquet)

    • 包含用户从一个或多个运行创建的所有提交及其相关的货币奖励信息。
    • 字段:submission_id(提交唯一标识符)、user_id(创建提交的用户标识符)、eval_name(评估类型,与运行数据集中的eval_name相似)、commentary(用户提供的额外注释)、run_ids(用于提交的一个或多个运行标识符)、evidence(用户包含的任何证据文件)、created_at(提交创建时间)、created_type('API'或'UI',指示提交是通过Crucible用户界面创建还是通过Crucible Web API端点上传)、status('draft'表示未提交到Bugcrowd,'new'表示已提交)、bugcrowd_id(Bugcrowd中的提交唯一标识符)、monetary_amount(提交总美元奖金)。
  4. 样本数据(grt2_samples.csv, grt2_samples.parquet)

    • 包含与给定运行链接的所有请求/响应对及其评分输出。
    • 字段:run_id(样本链接到的运行唯一标识符)、sample_id(运行内的样本标识符,如果epoch > 1则可能不唯一)、epoch(如果大于1,则表示相同的输入被多次运行)、input(原始输入文本)、response(模型的响应文本)、评分列(如果启用了给定的评分指标,则包含值,否则为null)。

数据用途概述: 该数据集适用于网络安全研究、机器学习模型评估、生成对抗技术研究以及教育和培训等多种场景。研究人员可以利用此数据集进行模型性能评估、生成内容的伦理和安全分析;教育者可以使用此数据集进行相关课程的教学;安全专家可以依据数据进行漏洞检测和防御策略制定。此外,数据集还适合用于教育和培训,帮助学习者理解生成对抗技术及其实战应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 128.97 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。