-
NICKLE_Based_韩国英语学习者中介语语料库数据
2026年1月30日 30 96 82
数据集概述 本数据集为NICKLE(Neungyule韩国英语学习者中介语语料库),含约100万词,包含书面和口语内容(比例约9:1),按主题和交际语境分为不同文本类型。语料库未明确标注 proficiency 水平,主要涵盖基础至中级水平,部分含高级文本,可通过来源大学名称或文本长度识别。 文件详解 文件名称:Basic statistical...
-
PHRAME_RITA_意大利语二语学习者CEFR认证考试文本数据集
2026年1月25日 30 126 13
数据集概述 本数据集为RITA(意大利语测试评估资源),包含意大利语二语学习者为获取CEFR语言能力认证而撰写的学术考试文本,是自然语言处理(NLP)领域的专用数据集。数据由意大利研究部PRIN项目“PHRAME”开发,源自同一项目下的CELI语料库,支持CSV和XML格式的自动处理。 文件详解 文件名称:RITA_PHRAME4.zip...
-
Shouting_at_Memory_Based_内存写操作研究补充材料数据
2026年1月20日 30 203 20
数据集概述 本数据集是论文《Shouting at Memory: Where Did My Write Go?》的补充材料,以压缩包形式提供,包含支持该论文研究的相关补充信息,为理解内存写操作的相关研究内容提供辅助数据。 文件详解 文件名称:Supplementary-Material_Shouting-at-Memory-Where-Did-My-...
-
编程谜题源代码_Python实现_程序语义推理_自然语言标注数据_2023年10月22日
2026年1月13日 30 45 18
数据集概述 本数据集包含用于程序语义推理的Python语句自然语言标注,由共享文件名前缀的文件对组成。数据源自Programming Puzzles项目,以压缩包形式提供,包含标注文件和参考源代码文件两类,可支持程序语义理解相关的研究与应用。 文件详解 压缩包文件 文件名称:archive_22102023.zip 文件格式:ZIP...
-
NeuralStateAnalysis_Based_深度学习程序API使用违规故障定位研究复制包
2026年1月11日 30 66 26
数据集概述 本数据集是研究论文的复制包,用于复现基于类型状态的深度学习程序API使用违规故障定位方法。包含两个基准测试集(NeuraLint的Benchmark1和Humbatova et al.的Benchmark2)及NeuralStateAnalysis工具代码,支持用户通过指定步骤复现论文结果。 文件详解...
-
CASAS智能家居脚本化复杂活动与认知相关错误注入数据集
2025年12月25日 30 110 42
数据集概述 该数据集为华盛顿州立大学CASAS智能公寓测试床采集的环境数据,包含328名参与者完成8项脚本化活动(含认知相关错误注入)的传感器读数,记录正常执行与错误执行(含遗漏、替代等四类错误)的活动数据。 文件详解 压缩文件: cognitive_errors.zip: 压缩包,包含以下内容: RawData文件夹:...
-
MISRA_C编码指南眼动追踪研究数据集
2025年12月23日 30 65 19
数据集概述 该数据集包含MISRA C编码指南主题的眼动追踪研究材料与数据,涵盖刺激材料、问卷及结构化数据,为分析编码指南对错误检测、时间消耗等认知过程的影响提供支持。 文件详解 文件名称: stimuli.zip 文件格式: ZIP 内容说明: 实验刺激材料压缩包 文件名称: questionnaire.pdf 文件格式: PDF 内容说明:...
-
基于注视的排版任务错误相关电位数据集
2025年12月22日 30 93 45
数据集概述 该数据集聚焦于基于注视的排版任务中的错误相关电位,通过眼动仪同步记录参与者的眼动轨迹与脑电波数据,旨在关联生理活动模式与排版错误(含眼动仪误差或人为失误),为相关研究提供基础数据。 文件详解 文件名称:ErrP data description.pdf 文件格式:PDF(.pdf)...
-
ICDAR2019后OCR文本校正竞赛数据集
2025年12月19日 30 183 55
数据集概述 该数据集为ICDAR2019后OCR文本校正竞赛的语料库,包含约2200万字符的OCR文本及对应标准文本(GS),源自法国国家图书馆、大英图书馆等机构的数字馆藏,用于训练和评估后OCR文本校正方法。 文件详解...
-
可配置系统编译错误识别大语言模型能力评估数据集2024
2025年12月18日 30 84 28
数据集概述 该数据集包含对大语言模型(LLMs)识别可配置系统编译错误能力评估的查询日志文件,数据来源于Albuquerque et al. 2024(SBES-IIER 2024)的相关研究,为分析LLMs在该任务中的表现提供支持。 文件详解 文件名称: sheet.css,文件格式: CSS,用于网页样式定义 文件名称: Small -...
-
MSR2021论文附录_离一错误学习实证研究
2025年12月15日 30 190 71
数据集概述 本数据集为MSR 2021会议论文《Learning Off-By-One Mistakes: An Empirical Study》的附录资料,包含论文相关的补充文档与代码文件,为理解离一错误学习的实证研究提供支持。 文件详解 文件名称: appendix.pdf 文件格式: PDF (.pdf) 内容说明: MSR...
-
基础设施即代码配置错误分类数据集
2025年12月5日 30 127 122
数据集概述 该数据集是论文《Towards a Taxonomy of Infrastructure as Code Misconfigurations: An Ansible Study》的复现包,包含基础设施即代码(IaC)配置错误的分类研究相关文件,为理解Ansible环境下的IaC配置错误类型提供支持。 文件详解...
-
越南语文本纠错数据集
2025年7月14日 60 178 115
越南语文本纠错数据集_Vietnamese_Text_Error_Correction_Dataset 数据来源:互联网公开数据 标签:文本纠错, 自然语言处理, 越南语, 错误检测, 语言模型, 深度学习, 数据标注, 文本校对 数据概述:...
-
Eurecat图像错误检测数据集ImageswithErrorsEurecatDataset-gerardcastro
2025年5月30日 30 105 102
Eurecat图像错误检测数据集ImageswithErrorsEurecatDataset-gerardcastro 数据来源:互联网公开数据 标签:图像处理,错误检测,数据集,计算机视觉,深度学习,图像分析,质量控制,工业应用 数据概述:...
-
英语写作评估语料校对数据集EnglishEssayEvaluationCorpuswithCorrections-huonglientrinh
2025年5月30日 30 66 4
英语写作评估语料校对数据集EnglishEssayEvaluationCorpuswithCorrections-huonglientrinh 数据来源:互联网公开数据 标签:英语写作, 文本校对, 错误检测, 文本分析, 自然语言处理, 写作评估, 语言学习, 机器阅卷 数据概述:...
-
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom
2025年5月30日 30 39 30
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 错误检测, 文本校对, 机器学习, 深度学习, 语料库 数据概述:...
-
英语语法纠错对比数据集EnglishGrammarErrorCorrectionComparison-austuvarki
2025年5月30日 30 54 12
英语语法纠错对比数据集EnglishGrammarErrorCorrectionComparison-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 语言模型, 自然语言处理, 机器翻译, 数据增强, 错误检测, 文本生成 数据概述:...
-
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy
2025年5月29日 30 15 2
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy 数据来源:互联网公开数据 标签:文本纠错, 越南语, 自然语言处理, 语言模型, 错误检测, 文本校正, 深度学习, 数据集 数据概述: 该数据集包含越南语文本,记录了原始句子及其对应的错误句子,用于越南语文本纠错任务。主要特征如下:...
-
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx
2025年5月29日 30 176 135
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx 数据来源:互联网公开数据 标签:文本校对, 润色, 错误检测, 自然语言处理, 文本纠错, 机器学习, 数据清洗, 语料库 数据概述:...
-
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1
2025年5月29日 30 206 189
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1 数据来源:互联网公开数据 标签:自然语言处理,文本分析,错误检测,机器学习,语言工具,数据集,语法检查,文本处理 数据概述:...



