数据集 - 海数据

多智能体系统遗留网络应用自主升级评估数据

2026年2月9日 30 108 74

数据集概述本数据集记录了基于大语言模型（LLM）的多智能体系统在遗留Web应用自主升级任务中的评估结果。通过零样本学习（ZSL）和单样本学习（OSL）提示，对比多智能体系统与独立LLM在代码更新中的错误类型、频率及复杂任务需求满足情况，验证多智能体系统在跨任务上下文保持和升级效率上的优势。文件详解文件名称：results multi-agent...

ZIP

复现资源包_面向服务计算的大语言模型研究

2026年2月9日 30 146 65

数据集概述本数据集为面向服务计算领域大语言模型研究的复现资源包，包含3个文件，涉及研讨会数据、研究设计图表及方法论图表三类内容，覆盖原始数据处理类型，无目录层级，未划分训练测试或数据标签集，支持相关研究的复现与参考。文件详解 Workshop-LLM...

ZIP

NorMedQA_Based挪威医疗问答基准数据集

2026年2月9日 30 14 13

数据集概述本数据集为挪威医疗问答基准数据集（NorMedQA），包含1313条纯文本医疗问答对和1401条含图片的医疗问答对（图片版本仍在开发中），主要使用挪威语（书面挪威语和新挪威语），用于评估大语言模型在挪威医疗场景下的知识检索与推理能力。数据源于公开医疗考试问题，经清洗预处理，以JSON格式存储。文件详解...

ZIP

PEQQS_Based_科学文献数量型问答检索全流程评估数据集

2026年2月9日 30 71 59

数据集概述本数据集聚焦科学文献中的数量型抽取式问答场景，包含1031篇农业科学摘要的数量答案标注，以及基于39个查询的1130条查询-文档相关性判断。数据集支持信息检索与问答模块的端到端评估，可用于研究检索质量对下游问答结果的影响，尤其是大语言模型处理无关文档时的幻觉问题。文件详解 quantities_ground_truth.json...

ZIP

EHSAN可解释医疗保健情感分析NLP数据集

2026年2月1日 30 111 20

数据集概述本数据集为EHSAN（可解释医疗情感标注）数据集，包含医疗领域的情感标注数据及实验代码相关文件，共6个文件，均为XLSX格式，无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容，以及大语言模型标注的数据集。文件详解 Final_train_topic_and_sentiment.xlsx 文件格式：XLSX...

ZIP

LINDDUN_Based隐私威胁类型与特征映射数据

2026年1月31日 30 170 131

数据集概述本数据集提供LINDDUN隐私威胁类型与低级别威胁特征的映射关系，映射对象为六篇特定领域隐私威胁分类学出版物中讨论的隐私威胁。映射表包含威胁在出版物中的位置、具体威胁特征及映射依据，支持标题为“Seven Samurai: Privacy Threat Types of LINDDUN”的相关研究。文件详解文件名称：mapping-...

ZIP

COVID_19社交媒体与科学出版物传播情境分析数据集

2026年1月31日 30 98 37

数据集概述本数据集包含社交媒体X上提及2020年10月7日发表的《Dying in a Leadership Vacuum》社论的帖子情感分析结果。数据通过Altmetric平台收集，经ChatGPT 3.5和Gemini 1.5 Flash进行情感分类，并与人工分类对比，涉及账户类型（机器人/人类）及分类一致性评估，共含九千余条帖子数据。文件详解...

ZIP

ChatGPT_Based_编程辅助工具性能评估数据集

2026年1月31日 30 147 102

数据集概述本数据集围绕ChatGPT作为编程辅助工具的能力评估构建，包含三类模型响应数据：一是ChatGPT、Codex、CodeGen在LeetCode基准测试的代码生成结果；二是ChatGPT与Codex针对代码修复和解释的响应；三是ChatGPT_D与Codex_D的代码修复和解释响应。数据集以压缩包形式存储，共3个文件。文件详解...

ZIP

ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据

2026年1月30日 30 195 72

数据集概述本数据集为斯洛文尼亚气候问答基准（ClimaQA_SLO），用于检验大语言模型在斯洛文尼亚环境相关领域（如气候变化、能源、林业）的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容，支持评估模型的气候领域专业知识准确性。文件详解文件名称：ClimaQA_SLO.xlsx 文件格式：XLSX...

ZIP

ITeM_Based_移动应用意图式GUI测试迁移数据集

2026年1月30日 30 15 14

数据集概述本数据集为ISSTA25论文“Intention-Based GUI Test Migration for Mobile Apps using Large Language Models”配套数据，聚焦移动应用意图式GUI测试迁移场景，包含相关测试迁移数据，支持论文研究内容的复现与验证。文件详解文件名称：ITeM_Dataset.zip...

ZIP

LLM_Based_大语言模型辅助API误用修复研究数据

2026年1月30日 30 184 103

数据集概述本数据集与“Large Language Models Aided API Misuse Repair”研究相关，核心内容围绕大语言模型在API误用修复场景的应用。数据集包含一个压缩文件，未提供训练/测试、数据/标签或原始/处理数据的划分，无额外说明文档或内容预览。文件详解压缩文件文件名称：palfix.zip 文件格式：ZIP...

ZIP

LLMs_Heroes_Based_英雄主题问答文档数据

2026年1月30日 30 175 69

数据集概述本数据集围绕“LLMs Heroes”主题展开问答内容，包含一份问答文档，可用于了解该主题下的相关问答信息，为相关研究或应用提供基础数据支持。文件详解文件名称：Questions and Answers_LLMs_Heroes.docx 文件格式：DOCX 字段映射介绍：文档类文件，具体字段信息未提供，推测包含与“LLMs...

ZIP

LLM中复制包的应用与关键IT治理挑战_我们是否已做好准备

2026年1月30日 30 190 106

数据集概述本数据集为论文“On Large Language Models in Mission-Critical IT Governance: Are We Ready Yet?”的复制包，包含原始问卷数据集及数据列与研究问题对应关系的说明文件，支持研究结果的复现与验证，共计一个压缩文件。文件详解 ReplicationPackage.zip...

ZIP

LLM_Based_医学教育SCT题目生成与专家评估数据集

2026年1月30日 30 138 0

数据集概述本数据集围绕医学教育中使用大语言模型生成脚本一致性测试（SCT）题目展开，包含Excel格式的专家评估数据与Word格式的提示模板及生成题目文件。Excel表记录了基于5类腹痛场景生成的SCT题目，经专家小组按12项标准评估的结果；Word文档提供了生成题目所用的提示模板及ChatGPT-4、Claude...

ZIP

LLM_Based_大语言模型数学应用题求解挑战分析结果数据

2026年1月29日 30 199 102

数据集概述本数据集包含不同大语言模型（LLMs）对SVAMP数据集数学应用题的求解输出，以及CodeLlama模型未能正确解决的问题标记语句。数据集共包含两个文件，可用于分析大语言模型在数学应用题求解中的挑战与不足。文件详解 all_data.json 文件格式：JSON 字段映射介绍：包含大语言模型针对SVAMP数据集生成的数学应用题求解样本数据...

ZIP

未加密数据_软件组织_法律硕士_LLM_采用案例及元综合分析

2026年1月29日 30 184 85

数据集概述本数据集为未编码数据，内容是从10项原始研究中提取的软件组织大语言模型采用情况相关信息，以Excel表格形式呈现。数据涵盖预定义编码、洞见标识、提取洞见及合成贡献标识等内容，用于支持案例元合成研究。文件详解文件名称：data.xlsx 文件格式：XLSX...

ZIP

LLM_Based_非结构化数据迁移至关系型数据库测试模型文档

2026年1月28日 30 13 3

数据集概述本数据集包含用于测试“利用预训练大语言模型将非结构化数据迁移至关系型数据库”方法的选定模型文档，核心内容围绕数据迁移方法的模型测试展开，共包含一个文档文件。文件详解文件名称：Modelos selecionados para testar a abordagem de Migração de Dados Não Estruturados...

ZIP

TGenAI_Based_LLM物联网系统功能测试用例生成数据

2026年1月28日 30 199 30

数据集概述本数据集为TGenAI方法相关的物联网系统功能测试用例生成数据，包含手动生成测试用例、LLM生成测试用例、GPT GUI测试用例及原始实验数据四类文件，总计4个文件，用于支撑物联网系统功能测试用例生成的相关研究与分析。文件详解手动测试用例文件文件名称：Manual Test Case Generation.zip 文件格式：ZIP...