数据集概述
本数据集包含希腊语隐私政策文本及相关分析数据,覆盖希腊访问量较高且提供希腊语隐私政策的网站。数据结合GDPR框架下的用户权利维度,可用于隐私合规性分析、政策文本特征研究等场景,总计包含十七份文件。
文件详解
- 隐私政策基础信息文件
- 文件名称:ranked_domains_gr_dataset-nodupl.csv
- 文件格式:CSV
- 字段映射介绍:包含Category(类别)、Rank(排名)、Domain(域名)、Effect year(生效年份)、Keywords in SERPs(搜索关键词)、Estimated organic traffic(预估自然流量)、Has privacy policy(是否有隐私政策)、Has privacy policy in Greek(是否有希腊语隐私政策)、Policy (in Greek) URL(希腊语政策链接)、Retrieved(获取状态)、Effect date(生效日期)、Comments(备注)、Manual annotation(人工标注)等字段。
- 用户权利分析文件
- 文件名称:user-rights.csv
- 文件格式:CSV
- 字段映射介绍:包含right to information(知情权)、right of access(访问权)、right to rectification(更正权)、right to erasure(删除权)、right to restriction of processing(限制处理权)、right to data portability(数据可携权)、right to object(反对权)、right to avoid automated decision-making(避免自动化决策权)等GDPR用户权利相关字段。
- 文本特征分析文件
- 文件名称:frequent-1grams.csv、frequent-3grams.csv
- 文件格式:CSV
- 字段映射介绍:分别记录隐私政策文本中的高频1元语法和3元语法特征数据。
- 网站权利标注文件
- 文件名称:uoa.gr-rights-annotated.xlsx、dreamstime.com-rights-annotated.xlsx、pinterest.com-rights-annotated.xlsx、e-food.gr-rights-annotated.xlsx等13个XLSX文件
- 文件格式:XLSX
- 字段映射介绍:针对特定网站隐私政策的用户权利标注数据,具体字段以各文件实际内容为准。
数据来源
PCI 2023论文“A privacy policies dataset in Greek in the GDPR era”
适用场景
- 隐私合规性评估:基于GDPR用户权利框架,分析希腊网站隐私政策的合规覆盖度
- 政策文本特征研究:利用1元语法、3元语法数据探索希腊语隐私政策的语言表达规律
- 数据隐私领域研究:支撑GDPR时代小语种隐私政策数据集的构建与应用研究
- 网站隐私政策对比分析:通过不同网站的权利标注数据,比较各行业隐私政策的差异