数据集概述
本数据集为论文《Insights from Publishing Open Data in Industry-Academia Collaboration》的补充数据,包含欧洲InSecTT项目参与者开放数据发布调查的二次数据,以及Zenodo平台近二十八万一千个数据集元数据分析结果,涉及动机、许可、文件类型等维度,辅助研究产学研合作中开放数据管理的关键问题。
文件详解
- survey.txt
- 文件格式:TXT
- 字段映射介绍:记录InSecTT项目11位参与者的开放数据发布调查结果,含开放式回答的主题分类(部分回答属于多类别),内容涉及数据收集经验教训等维度。
- secondary_data_zenodo.json
- 文件格式:JSON
- 字段映射介绍:包含Zenodo数据集元数据分析结果,结构键为datasets_per_year(年度数据集数量)、license_count(许可类型计数)、license_count_grouped(许可类型分组计数)、filetype_count_grouped(文件类型分组计数)。
- secondary_data_plot_script.py
- 文件格式:PY
- 内容说明:数据可视化示例脚本,用于处理和展示Zenodo元数据分析结果。
- secondary_data_plot_script.ipynb
- 文件格式:IPYNB
- 内容说明:数据可视化示例笔记本,含代码执行步骤与结果展示。
- README.md
- 文件格式:MD
- 内容说明:数据集说明文档,含作者信息、数据背景、文件清单等内容。
数据来源
论文《Insights from Publishing Open Data in Industry-Academia Collaboration》
适用场景
- 产学研合作开放数据管理研究:分析合作中开放数据发布的动机、挑战与经验教训。
- 开放数据平台元数据分析:基于Zenodo数据集元数据,研究许可类型、文件类型的分布特征。
- 开放数据复用性评估:探究数据集伴随脚本的覆盖率(仅百分之二点四)对复用性的影响。
- 开放数据政策制定参考:为产学研合作中开放数据许可选择、数据管理规范提供实证依据。
- 合成数据价值研究:分析模拟与实测混合的合成数据在开放数据发布中的意义与应用场景。