开源社区行为准则演进与影响研究复现数据包

数据集概述

本数据集是题为《Beyond Adoption: Examining the Evolution and Impact of Code of Conduct on Open Source Communities》研究的复现数据包,包含研究问题(RQ1、RQ2)相关的原始数据、分析代码、结果文件及补充材料,支持对开源社区行为准则(CoC)的演进过程与影响的复现分析。

文件详解

  • 文档类文件:
  • Readme.md:Markdown格式,可能包含数据集的使用说明、文件结构及研究背景介绍
  • Supplementary_material.pdf:PDF格式,包含研究问题1(RQ1)和研究问题2(RQ2)的补充图表、代码本及聚类结果
  • 研究问题1(RQ1)相关文件:
  • RQ1_1_CoC_repos.csv:CSV格式,包含所有有行为准则的代码仓库完整列表
  • RQ1_2_GPT_coding.md:Markdown格式,用于通过GPT对行为准则更新类型进行编码的提示词
  • RQ1_2_clustering_results.csv:CSV格式,研究问题1.2的聚类结果数据
  • 研究问题2(RQ2)相关文件:
  • RQ2_1_DiD.ipynb:Jupyter Notebook格式,用于双重差分(DiD)分析的代码,探究行为准则采用对社区参与度的影响
  • RQ2_1_DiD_data.csv:CSV格式,双重差分分析的输入数据,包含不同时间差(1个月、3个月、6个月、9个月、12个月)的对照组与处理组数据
  • RQ2_1_DiD_results.csv:CSV格式,双重差分分析的输出结果
  • RQ2_2_CoC_attributes.ipynb:Jupyter Notebook格式,用于分析行为准则更新特征与社区参与度关系的代码
  • RQ2_2_CoC_attributes_data.csv:CSV格式,行为准则更新分析的输入数据
  • RQ2_2_CoC_attributes_results.csv:CSV格式,行为准则更新分析的输出结果

适用场景

  • 开源社区治理研究:分析行为准则在开源社区中的演进过程与实施效果
  • 社区参与度影响因素分析:探究行为准则采用及更新特征对社区参与度的作用机制
  • 计量经济学方法应用:验证双重差分模型在开源社区行为研究中的适用性
  • 自然语言处理应用:研究GPT在行为准则文本编码任务中的效果与应用场景
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 19.54 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。