-
多智能体系统遗留网络应用自主升级评估数据
2026年2月9日 30 108 74
数据集概述 本数据集记录了基于大语言模型(LLM)的多智能体系统在遗留Web应用自主升级任务中的评估结果。通过零样本学习(ZSL)和单样本学习(OSL)提示,对比多智能体系统与独立LLM在代码更新中的错误类型、频率及复杂任务需求满足情况,验证多智能体系统在跨任务上下文保持和升级效率上的优势。 文件详解 文件名称:results multi-agent...
-
复现资源包_面向服务计算的大语言模型研究
2026年2月9日 30 146 65
数据集概述 本数据集为面向服务计算领域大语言模型研究的复现资源包,包含3个文件,涉及研讨会数据、研究设计图表及方法论图表三类内容,覆盖原始数据处理类型,无目录层级,未划分训练测试或数据标签集,支持相关研究的复现与参考。 文件详解 Workshop-LLM...
-
NorMedQA_Based挪威医疗问答基准数据集
2026年2月9日 30 14 13
数据集概述 本数据集为挪威医疗问答基准数据集(NorMedQA),包含1313条纯文本医疗问答对和1401条含图片的医疗问答对(图片版本仍在开发中),主要使用挪威语(书面挪威语和新挪威语),用于评估大语言模型在挪威医疗场景下的知识检索与推理能力。数据源于公开医疗考试问题,经清洗预处理,以JSON格式存储。 文件详解...
-
PEQQS_Based_科学文献数量型问答检索全流程评估数据集
2026年2月9日 30 71 59
数据集概述 本数据集聚焦科学文献中的数量型抽取式问答场景,包含1031篇农业科学摘要的数量答案标注,以及基于39个查询的1130条查询-文档相关性判断。数据集支持信息检索与问答模块的端到端评估,可用于研究检索质量对下游问答结果的影响,尤其是大语言模型处理无关文档时的幻觉问题。 文件详解 quantities_ground_truth.json...
-
EHSAN可解释医疗保健情感分析NLP数据集
2026年2月1日 30 111 20
数据集概述 本数据集为EHSAN(可解释医疗情感标注)数据集,包含医疗领域的情感标注数据及实验代码相关文件,共6个文件,均为XLSX格式,无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容,以及大语言模型标注的数据集。 文件详解 Final_train_topic_and_sentiment.xlsx 文件格式:XLSX...
-
LINDDUN_Based隐私威胁类型与特征映射数据
2026年1月31日 30 170 131
数据集概述 本数据集提供LINDDUN隐私威胁类型与低级别威胁特征的映射关系,映射对象为六篇特定领域隐私威胁分类学出版物中讨论的隐私威胁。映射表包含威胁在出版物中的位置、具体威胁特征及映射依据,支持标题为“Seven Samurai: Privacy Threat Types of LINDDUN”的相关研究。 文件详解 文件名称:mapping-...
-
COVID_19社交媒体与科学出版物传播情境分析数据集
2026年1月31日 30 98 37
数据集概述 本数据集包含社交媒体X上提及2020年10月7日发表的《Dying in a Leadership Vacuum》社论的帖子情感分析结果。数据通过Altmetric平台收集,经ChatGPT 3.5和Gemini 1.5 Flash进行情感分类,并与人工分类对比,涉及账户类型(机器人/人类)及分类一致性评估,共含九千余条帖子数据。 文件详解...
-
ChatGPT_Based_编程辅助工具性能评估数据集
2026年1月31日 30 147 102
数据集概述 本数据集围绕ChatGPT作为编程辅助工具的能力评估构建,包含三类模型响应数据:一是ChatGPT、Codex、CodeGen在LeetCode基准测试的代码生成结果;二是ChatGPT与Codex针对代码修复和解释的响应;三是ChatGPT_D与Codex_D的代码修复和解释响应。数据集以压缩包形式存储,共3个文件。 文件详解...
-
ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据
2026年1月30日 30 195 72
数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
-
ITeM_Based_移动应用意图式GUI测试迁移数据集
2026年1月30日 30 15 14
数据集概述 本数据集为ISSTA25论文“Intention-Based GUI Test Migration for Mobile Apps using Large Language Models”配套数据,聚焦移动应用意图式GUI测试迁移场景,包含相关测试迁移数据,支持论文研究内容的复现与验证。 文件详解 文件名称:ITeM_Dataset.zip...
-
LLM_Based_大语言模型辅助API误用修复研究数据
2026年1月30日 30 184 103
数据集概述 本数据集与“Large Language Models Aided API Misuse Repair”研究相关,核心内容围绕大语言模型在API误用修复场景的应用。数据集包含一个压缩文件,未提供训练/测试、数据/标签或原始/处理数据的划分,无额外说明文档或内容预览。 文件详解 压缩文件 文件名称:palfix.zip 文件格式:ZIP...
-
LLMs_Heroes_Based_英雄主题问答文档数据
2026年1月30日 30 175 69
数据集概述 本数据集围绕“LLMs Heroes”主题展开问答内容,包含一份问答文档,可用于了解该主题下的相关问答信息,为相关研究或应用提供基础数据支持。 文件详解 文件名称:Questions and Answers_LLMs_Heroes.docx 文件格式:DOCX 字段映射介绍:文档类文件,具体字段信息未提供,推测包含与“LLMs...
-
LLM中复制包的应用与关键IT治理挑战_我们是否已做好准备
2026年1月30日 30 190 106
数据集概述 本数据集为论文“On Large Language Models in Mission-Critical IT Governance: Are We Ready Yet?”的复制包,包含原始问卷数据集及数据列与研究问题对应关系的说明文件,支持研究结果的复现与验证,共计一个压缩文件。 文件详解 ReplicationPackage.zip...
-
LLM_Based_医学教育SCT题目生成与专家评估数据集
2026年1月30日 30 138 0
数据集概述 本数据集围绕医学教育中使用大语言模型生成脚本一致性测试(SCT)题目展开,包含Excel格式的专家评估数据与Word格式的提示模板及生成题目文件。Excel表记录了基于5类腹痛场景生成的SCT题目,经专家小组按12项标准评估的结果;Word文档提供了生成题目所用的提示模板及ChatGPT-4、Claude...
-
LLM_Based_大语言模型数学应用题求解挑战分析结果数据
2026年1月29日 30 199 102
数据集概述 本数据集包含不同大语言模型(LLMs)对SVAMP数据集数学应用题的求解输出,以及CodeLlama模型未能正确解决的问题标记语句。数据集共包含两个文件,可用于分析大语言模型在数学应用题求解中的挑战与不足。 文件详解 all_data.json 文件格式:JSON 字段映射介绍:包含大语言模型针对SVAMP数据集生成的数学应用题求解样本数据...
-
未加密数据_软件组织_法律硕士_LLM_采用案例及元综合分析
2026年1月29日 30 184 85
数据集概述 本数据集为未编码数据,内容是从10项原始研究中提取的软件组织大语言模型采用情况相关信息,以Excel表格形式呈现。数据涵盖预定义编码、洞见标识、提取洞见及合成贡献标识等内容,用于支持案例元合成研究。 文件详解 文件名称:data.xlsx 文件格式:XLSX...
-
LLM_Based_非结构化数据迁移至关系型数据库测试模型文档
2026年1月28日 30 13 3
数据集概述 本数据集包含用于测试“利用预训练大语言模型将非结构化数据迁移至关系型数据库”方法的选定模型文档,核心内容围绕数据迁移方法的模型测试展开,共包含一个文档文件。 文件详解 文件名称:Modelos selecionados para testar a abordagem de Migração de Dados Não Estruturados...
-
TGenAI_Based_LLM物联网系统功能测试用例生成数据
2026年1月28日 30 199 30
数据集概述 本数据集为TGenAI方法相关的物联网系统功能测试用例生成数据,包含手动生成测试用例、LLM生成测试用例、GPT GUI测试用例及原始实验数据四类文件,总计4个文件,用于支撑物联网系统功能测试用例生成的相关研究与分析。 文件详解 手动测试用例文件 文件名称:Manual Test Case Generation.zip 文件格式:ZIP...
-
AutoPDL_Based_LLM智能体自动提示优化处理数据集
2026年1月28日 30 176 130
数据集概述 本数据集为AutoPDL(LLM智能体自动提示优化)相关的处理后数据集,包含一个压缩文件,未区分训练/测试、数据/标签或原始/处理数据,无额外说明文档或内容预览,可用于LLM智能体提示优化相关研究。 文件详解 文件名称:datasets.zip 文件格式:ZIP...
-
ChatGPT_Based_自然语言需求不一致性检测评估补充数据
2026年1月28日 30 101 81
数据集概述 本数据集为论文《Inconsistencies Detection in Natural Language Requirements using ChatGPT: a Preliminary...



