PCI_2023_Based_GDPR时代希腊隐私政策数据集

数据集概述

本数据集包含希腊语隐私政策文本及相关分析数据,覆盖希腊访问量较高且提供希腊语隐私政策的网站。数据结合GDPR框架下的用户权利维度,可用于隐私合规性分析、政策文本特征研究等场景,总计包含十七份文件。

文件详解

  • 隐私政策基础信息文件
  • 文件名称:ranked_domains_gr_dataset-nodupl.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Category(类别)、Rank(排名)、Domain(域名)、Effect year(生效年份)、Keywords in SERPs(搜索关键词)、Estimated organic traffic(预估自然流量)、Has privacy policy(是否有隐私政策)、Has privacy policy in Greek(是否有希腊语隐私政策)、Policy (in Greek) URL(希腊语政策链接)、Retrieved(获取状态)、Effect date(生效日期)、Comments(备注)、Manual annotation(人工标注)等字段。
  • 用户权利分析文件
  • 文件名称:user-rights.csv
  • 文件格式:CSV
  • 字段映射介绍:包含right to information(知情权)、right of access(访问权)、right to rectification(更正权)、right to erasure(删除权)、right to restriction of processing(限制处理权)、right to data portability(数据可携权)、right to object(反对权)、right to avoid automated decision-making(避免自动化决策权)等GDPR用户权利相关字段。
  • 文本特征分析文件
  • 文件名称:frequent-1grams.csv、frequent-3grams.csv
  • 文件格式:CSV
  • 字段映射介绍:分别记录隐私政策文本中的高频1元语法和3元语法特征数据。
  • 网站权利标注文件
  • 文件名称:uoa.gr-rights-annotated.xlsx、dreamstime.com-rights-annotated.xlsx、pinterest.com-rights-annotated.xlsx、e-food.gr-rights-annotated.xlsx等13个XLSX文件
  • 文件格式:XLSX
  • 字段映射介绍:针对特定网站隐私政策的用户权利标注数据,具体字段以各文件实际内容为准。

数据来源

PCI 2023论文“A privacy policies dataset in Greek in the GDPR era”

适用场景

  • 隐私合规性评估:基于GDPR用户权利框架,分析希腊网站隐私政策的合规覆盖度
  • 政策文本特征研究:利用1元语法、3元语法数据探索希腊语隐私政策的语言表达规律
  • 数据隐私领域研究:支撑GDPR时代小语种隐私政策数据集的构建与应用研究
  • 网站隐私政策对比分析:通过不同网站的权利标注数据,比较各行业隐私政策的差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.4 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。