-
CVulDB_Based_GitHub_C语言项目CVE漏洞提交记录完整数据
2026年1月20日 30 138 23
数据集概述 本数据集包含GitHub平台所有C语言项目中涉及CVE漏洞编号的提交记录,以压缩包形式存储,文件大小约125MB。数据按项目所有者和名称构建文件夹结构,每个项目文件夹内存储以"CVE编号_提交哈希"命名的差异文件,可用于C语言项目的漏洞分析与安全研究。 文件详解 文件名称:CVE_Diffs.zip 文件格式:ZIP...
-
GitHub_Based_软件部分修复程序识别与完整修复建议基准数据集
2026年1月22日 30 39 17
数据集概述 本数据集是用于自动化程序修复工具的真实世界基准任务集合,聚焦于识别部分修复(Partial Fixes)并生成完整修复方案。通过GitHub API获取候选闭源问题,结合重新打开的问题及CI状态筛选策略,构建了包含超2000个部分修复案例的基准集,为相关工具提供测试与优化支撑。 文件详解 文件名称:partial-fix.zip...
-
DocGen_DySDoc_3_Apache_POI预处理数据_挑战赛数据集
2026年1月20日 30 191 110
数据集概述 本数据集为第三届动态软件文档国际研讨会(DySDoc 3)举办的首届软件文档生成挑战赛(DocGen)提供的Apache POI 3.17预处理数据,包含调用图、继承层次、问题记录、提交记录及StackOverflow帖子5类数据,支撑软件文档生成相关研究。 文件详解 调用图数据 文件名称:call-graph-...
-
Refactoring_Volatility_Research_完整结果与数据集
2026年1月19日 30 131 61
数据集概述 本数据集是《重构波动性研究》论文的配套数据,包含48个项目的重构实例数据、研究问题(RQ1、RQ2、RQ4)的结果文件及分析脚本,支持实验复现与后续研究扩展。数据覆盖重构类型的统计结果、指标采集工具、样本数据集及原因分析示例,共5个文件。 文件详解 Refactoring dataset.zip 文件格式:ZIP...
-
PROGpedia_University_of_Porto_编程练习提交数据_2003_2020
2026年1月8日 30 103 2
数据集概述 本数据集包含2003-2020年间波尔图大学理学院计算机科学本科生在Mooshak平台上完成的16个编程练习的提交记录,提取了代码属性图并与源代码一起存储为CSV文件,可用于编程教育相关分析。 文件详解 文件名称:progpedia.zip 文件格式:ZIP...
-
开发者与ChatGPT对话数据集2023
2025年12月22日 30 180 147
数据集概述 该数据集是经过整理的开发者与ChatGPT对话数据集,包含一万七千九百一十三条提示词及ChatGPT的回复(含一万一千七百五十一个代码片段),并关联了源代码、提交记录、问题、拉取请求、讨论及Hacker News帖子等软件开发工件,为分析开发者与ChatGPT交互的背景及影响提供支持。 文件详解 文件名称: DevGPT.zip 文件格式:...
-
Kotlin_Java跨依赖问题实证研究数据集及工具
2025年12月15日 30 21 10
数据集概述 本数据集为Kotlin-Java跨依赖问题实证研究的配套资源,包含验证工具准确性的手动数据、各研究问题(RQ1至RQ4)的分析数据(如依赖图、维护成本、常见错误),以及用于提取依赖和检测错误的可运行工具。 文件详解 目录结构及内容: accuracy-verification:工具提取Kotlin-Java依赖的手动验证数据...
-
开源软件开发者从问答网站复用架构方案的实证研究数据集
2025年12月8日 30 52 12
数据集概述 该数据集为《开源软件开发者如何从问答网站复用架构方案:一项实证研究》论文的配套数据,包含挖掘研究的提交与问题数据、调查研究的问卷设计、邀请邮件及有效回复,以及MAXQDA分析结果文件,支持复现研究结论。 文件详解 Commits and Issues.xlsx:Excel格式文件,包含挖掘研究的984条提交记录与问题数据 Survey...
-
GitHub上AI编码代理研究数据集
2025年12月7日 30 103 52
数据集概述 该数据集围绕GitHub平台上的AI编码代理展开研究,包含与AI编码代理相关的各类结构化数据文件(Parquet格式)、说明文档及图片文件,为分析AI在软件工程中的应用提供数据支持。 文件详解 该数据集包含多种格式的文件,具体说明如下: - 说明文档类: - README.md: Markdown格式的说明文档,介绍数据集背景及使用方法 -...
-
函数级软件漏洞检测数据集
2025年12月4日 30 172 59
数据集概述 该数据集包含基于ARES'25论文规则预处理的函数级软件漏洞检测数据,以CSV格式存储,同时提供源代码压缩包。数据涵盖漏洞代码与补丁代码及其相关属性,如编程语言、CWE/CVE信息、提交记录等,为软件安全领域的漏洞检测研究提供结构化数据支持。 文件详解 源代码压缩包: vuln_patching_ares.zip:...
-
开放平台SCP提交数据集3OpenPlatformSCPSubmissions3-mirenaborisova
2025年5月29日 30 5 3
开放平台SCP提交数据集3OpenPlatformSCPSubmissions3-mirenaborisova 数据来源:互联网公开数据 标签:SCP,异常物品,数据集,科幻,提交记录,社区贡献,数据分析,开源数据 数据概述:该数据集包含来自开放平台SCP网站的提交记录,记录了用户提交的各种异常物品(SCP)的相关信息。主要特征如下:...
-
提交数据分析数据集SubmissionDataAnalysisDataset-shaunakjoshi
2025年4月25日 30 34 9
提交数据分析数据集SubmissionDataAnalysisDataset-shaunakjoshi 数据来源:互联网公开数据 标签:数据分析,数据集,提交记录,机器学习,用户行为,预测分析,时间序列,用户研究 数据概述: 该数据集包含来自多个在线平台的提交记录数据,记录了用户提交的详细信息,适用于数据分析,预测和用户行为研究。主要特征如下:...
-
乔什-麦肯尼提交数据集1JoshMckenneySubmission1Dataset-jmckenney1
2025年4月25日 30 153 63
乔什-麦肯尼提交数据集1JoshMckenneySubmission1Dataset-jmckenney1 数据来源:互联网公开数据 标签:数据集,提交记录,文本分析,机器学习,数据挖掘,自然语言处理,学术研究,信息检索 数据概述: 该数据集包含来自乔什·麦肯尼提交的记录数据,记录了特定提交内容的相关信息。主要特征如下:...
-
提交列表数据集SubmissionListDataset-horikk
2025年4月24日 30 112 16
提交列表数据集SubmissionListDataset-horikk 数据来源:互联网公开数据 标签:数据集,提交记录,项目管理,数据分析,效率评估,在线平台,日志分析 数据概述: 该数据集包含来自在线提交平台的提交记录数据,记录了用户提交任务的时间和状态等信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
-
Shopee价格匹配提交数据集ShopeePriceMatchSubmissionDataset-corneliustantius
2025年4月24日 30 204 35
Shopee价格匹配提交数据集ShopeePriceMatchSubmissionDataset-corneliustantius 数据来源:互联网公开数据 标签:电商,价格匹配,数据集,提交记录,机器学习,数据分析,商业智能,零售业 数据概述:该数据集包含来自Shopee的价格匹配提交记录,记录了用户提交的价格匹配请求及其处理结果。主要特征如下:...
-
失败提交记录数据集FailedSubmissionsDataset-liimaxime
2025年4月24日 30 34 14
失败提交记录数据集FailedSubmissionsDataset-liimaxime 数据来源:互联网公开数据 标签:数据集,提交记录,失败分析,质量控制,软件开发,项目管理,人工智能,机器学习 数据概述: 该数据集包含来自软件开发和项目管理领域的失败提交记录,记录了项目开发过程中提交失败的详细情况。主要特征如下:...
-
历史提交记录数据集PreviousSubmissionsDataset-rohitpattanaik
2025年4月23日 30 153 29
历史提交记录数据集PreviousSubmissionsDataset-rohitpattanaik 数据来源:互联网公开数据 标签:数据集,提交记录,历史数据,项目管理,数据分析,机器学习,时间序列,教育研究 数据概述: 该数据集包含来自多个项目的历史提交记录数据,记录了用户或参与者在项目中的提交行为和时间信息。主要特征如下:...
-
电影市场预测提交数据集MovieMarketPredictionSubmissionsDataset-isaacvm98
2025年4月22日 30 63 40
电影市场预测提交数据集MovieMarketPredictionSubmissionsDataset-isaacvm98 数据来源:互联网公开数据 标签:电影市场,预测,提交记录,数据集,商业分析,机器学习,经济学,市场研究 数据概述:该数据集包含来自电影市场预测竞赛的提交记录,记录了参赛者对电影市场表现的预测结果。主要特征如下:...
-
Codeforces顶尖1000名程序员竞赛表现数据集-2023年
2025年4月15日 30 59 34
Codeforces顶尖1000名程序员竞赛表现数据集-2023年 数据来源:互联网公开数据 标签:Codeforces,程序员,竞赛,编程,排行榜,数据集,API,活跃用户,提交记录 数据概述:...
-
Kaggle比赛私人排行榜数据集
2025年4月15日 30 155 98
Kaggle比赛私人排行榜数据集 数据来源:互联网公开数据 标签:Kaggle,比赛排行榜,团队表现,提交记录,预测分析,数据可视化,竞赛分析 数据概述:...



