Privy_Based_PII标注协议轨迹数据集

数据集概述

本数据集是包含标注的PII数据集,内容为基于OpenAPI规范生成的协议轨迹,涵盖JSON、SQL(PostgreSQL、MySQL)、HTML和XML格式,包含六十多种PII类型。数据集以压缩包形式提供,无目录层级和文件分割。

文件详解

  • 文件名称:privy-dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含基于OpenAPI规范生成的协议轨迹数据,涵盖JSON、SQL(PostgreSQL、MySQL)、HTML、XML四种格式,标注有六十多种PII类型;无训练/测试、数据/标签、原始/处理数据的分割,无命名模式。

适用场景

  • 隐私数据识别模型训练: 用于训练和优化识别多种PII类型的算法模型,提升信息安全领域的隐私保护能力。
  • 多格式协议轨迹分析: 分析JSON、SQL、HTML、XML等不同格式协议轨迹中的PII分布特征。
  • 信息安全合规研究: 支持隐私保护合规性检查相关的技术研究与工具开发。
  • 数据隐私保护技术测试: 作为测试集验证隐私数据脱敏、匿名化等技术的效果。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 293.27 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。