-
ASE2021上下文感知代码变更嵌入补丁正确性评估数据集
2026年1月30日 30 159 68
数据集概述 本数据集是论文“Context-Aware Code Change Embedding for Better Patch Correctness Assessment”的配套数据,包含实验所用补丁基准、实验结果文件及模型源代码。补丁分为Small和Large两类,结果覆盖RQ1和RQ2研究问题,支持补丁正确性评估模型的验证与分析。 文件详解...
-
GMHP7k_Based_德语社交媒体厌女症仇恨言论标注语料库数据
2026年1月27日 30 89 46
数据集概述 本数据集为GMHP7k德语厌女症仇恨言论语料库,包含社交媒体平台用户发布的7061条帖子。由志愿者对每条帖子进行仇恨言论和厌女症仇恨言论的二元标注,Fleiss' Kappa标注者间信度分别为0.6409和0.8258,同时提供基于BERT模型的基线分类结果,仇恨言论和厌女症仇恨言论宏平均F1-score最高达0.79和0.75。 文件详解...
-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 24 8
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
MentalHealth_SocialNetworks_Based_社交媒体心理健康评论多维度标注数据集
2025年12月31日 30 16 15
数据集概述 本数据集包含两个Excel文件及相关文档、代码,核心为社交媒体心理健康评论标注数据。数据源自Instagram平台名人心理健康披露相关帖子的评论,共2287条,分别标注了极性、污名属性及情感类别,同时提供机器学习分类模型代码,支持社交媒体心理健康相关文本分析研究。 文件详解 数据文件 文件名称:DatasetMH.xlsx...



