隐私政策本体数据集

数据集概述

本数据集围绕隐私政策中的信息类型术语构建,通过语法驱动方法解析术语构成并推断语义关系,形成可减少术语歧义的知识图谱(本体)。包含构建本体的词汇表、实验评估数据及相关文档,为隐私政策术语标准化、需求撰写指导等研究提供支持。

文件详解

该数据集包含多个目录和文件,具体说明如下: - 词汇表文件(Lexicons/ 目录): - Lexicon-L_1.csv、Lexicon-L_2.csv、Lexicon-L_3.csv:CSV格式原始词汇表文件,包含各类信息类型术语。 - 精简与标记词汇表文件(Reduced and Tagged Lexicons/ 目录): - Lexicon-L_1-Reduced-Tagged.csv、Lexicon-L_2-Reduced-Tagged.csv、Lexicon-L_3-Reduced-Tagged.csv:CSV格式标记后词汇表文件,字段包括“Information Type”(信息类型)、“Tag”(标签),记录术语及其语义标签。 - 实验与评估数据集(Experiments and Evaluation Datasets/ 目录,含4个实验子目录): - 以Experiment 1 (E_1)为例: - Experiment-E_1-Expert-GT-Relations.csv、Experiment-E_1-Expert-GT_1-Relations.csv:CSV格式专家标注的信息类型关系数据(真实值)。 - Experiment-E_1-Expert-GT-Ontology.owl:OWL格式专家标注的本体文件。 - Experiment-E_1-Syntax-Driven-Method-Relations.csv:CSV格式语法驱动方法生成的关系数据。 - 其他实验子目录(E_2至E_4)包含类似结构文件,部分实验含非专家标注数据(如Experiment-E_3-Non-Expert-GT-Relations.csv)。 - 文档文件: - semantic-attachments.pdf:PDF格式文档,可能包含语义规则、方法细节等补充说明。

适用场景

  • 隐私政策研究:分析隐私政策中信息类型术语的歧义性,探索术语标准化方法。
  • 本体构建与评估:验证语法驱动方法在信息类型术语语义关系推断中的有效性。
  • 需求工程应用:为隐私政策需求撰写者提供术语选择指导,提升需求表述清晰度。
  • 自然语言处理研究:用于信息抽取、语义解析等NLP任务在隐私政策领域的应用验证。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.74 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。