Instagram数据下载包结构与内容研究数据集

数据集概述

该数据集包含11个由研究人员生成的Instagram个人数据下载包(DDPs),用于研究其结构与内容。数据通过模拟用户密集使用Instagram一周生成,包含文本、图像等内容,特别设计用于评估去标识化软件性能。

文件详解

该数据集包含两类文件,具体说明如下: - 压缩文件: - 11个以用户名和下载日期命名的ZIP格式文件,如horsesarecool52_20201020.zip、geese_person_20201027.zip等 - 内容:Instagram数据下载包,包含用户使用过程中生成的文本(含荷兰语姓名、联系方式等)、图像(含人脸、第三方公开账号内容)等 - 说明文件: - readme.html:HTML格式的说明文档,提供数据集生成背景、使用方法等信息

数据来源

乌得勒支大学(Laura Boeschoten、Ruben van den Goorbergh、Daniel Oberski)

适用场景

  • 社交媒体数据结构分析:研究Instagram数据下载包的内容组成与文件结构
  • 去标识化技术评估:测试去标识化软件对社交媒体文本、图像中个人信息的处理性能
  • 数据隐私研究:分析社交媒体数据中的隐私信息类型与分布特征
  • 网络分析案例:基于模拟用户网络数据开展社交网络结构分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 140.66 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。