-
Supplementary_Dataset_Based_语法引导LLM输出物联网数据平台评估数据集
2026年1月6日 30 72 59
数据集概述 本数据集为语法引导大语言模型(LLM)输出物联网数据平台开放数据集成研究的补充数据,包含通过三种LLM(Qwen 2.5 Instruct、Llama 3.1 Instruct、Phi-4)处理六个开放数据源生成的720个符合OGC SensorThings...
-
JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop
2026年1月5日 30 49 42
数据集概述 本数据集是用于分析大语言模型(LLMs)越狱攻击与幻觉模式的基准数据集,包含语义对齐的越狱及事实性提示词,以及毒性变化、相似度得分、标注策略等元数据,支持LLM安全与事实一致性的评估研究。 文件详解 文件名称:README.md 文件格式:Markdown 字段映射介绍:包含数据集概述、开发背景、使用说明等文档内容...
-
Schulze_Balhorn_Based_ChatGPT自然科学与工程回答能力实证评估数据2023
2026年1月5日 30 73 50
数据集概述 本数据集围绕ChatGPT在自然科学与工程领域的回答能力展开实证评估,包含一份Excel文件,记录相关测试数据,用于分析ChatGPT在该领域的知识覆盖与回答表现。 文件详解 文件名称:Schulze Balhorn et al (2023) - What does ChatGPT know about natural science...
-
Fine_Tuning_Large_Language_Model_安全代码生成大语言模型微调复现数据
2026年1月5日 30 96 71
数据集概述 本数据集是论文“Fine Tuning Large Language Model for Secure Code Generation”的复现包,包含大语言模型微调所需的数据集及模型评估结果,用于支持安全代码生成方向的模型训练与性能验证研究,共包含3个文件。 文件详解 README.md 文件格式:MD...
-
SJT_Situational_Judgement_Test_Chat_GPT医疗伦理能力评估数据集
2026年1月4日 30 132 63
数据集概述 本数据集为评估Chat GPT(AI大语言模型)医疗伦理能力的研究数据,基于《Oxford Assess and Progress: Situational Judgement Test》书中252道SJT题目(含82道选择题、170道排序题)构建,记录模型回答与标准答案的对比结果,用于分析模型在医疗情境下的伦理判断准确性及一致性。...
-
Replication_package_Based_多智能体辩论策略增强需求工程系统映射研究复现包2025
2025年12月30日 30 201 57
数据集概述 本数据集是论文“Multi-Agent Debate Strategies to Enhance Requirements Engineering with Large Language Models”的系统映射研究复现包,包含该研究的补充资源,用于支持研究结果的复现与验证。数据对应IEEE RE'25会议RE@Next...
-
Health_Commissions_Based_大语言模型辅助健康委员会伤残报告生成与百分比评估研究数据
2025年12月30日 30 77 40
数据集概述 本数据集围绕健康委员会场景,研究ChatGPT-4与Data Analyst两款大语言模型在生成残疾报告、计算伤残百分比方面的应用。通过九个真实患者场景评估模型输出,聚焦与专家评估及指南的一致性、内容完整性和信息准确性,探索AI简化医疗行政流程的潜力。 文件详解 文件名称:Engellilik AI çalışması.docx...
-
LLM逆向工程序列图泛化能力复现数据包
2025年12月13日 30 130 108
数据集概述 本数据集是论文《On the Generalization Capabilities of LLMs for Reverse Engineering Sequence Diagrams》的复现数据包,包含实验所需的源代码、模型生成的序列图数据等,支持复现论文中的研究结果。 文件详解 RE-LLMs-...
-
无声肌电信号特征处理数据集2025
2025年12月23日 30 206 25
数据集概述 本数据集提供了用于ACL 2025论文研究的手工提取无声肌电信号(Silent EMG)特征表示,基于EMNLP 2020提出的原始无声肌电数据集,为探索大语言模型理解无声语音及肌电转文本任务提供支持。 文件详解 文件名称: extracted_emg_features-20250530T194147Z-1-001.zip 文件格式:...
-
智能合约模糊测试中基于漏洞引导优先级的LLM初始种子增强研究论文_artifacts
2025年12月23日 30 107 20
数据集概述 本数据集是论文《Exploring LLMs for Initial Seed Augmentation in Smart Contract Fuzzing with Vulnerability-Guided Prioritization》的配套artifacts,核心为一个压缩文件,用于支持论文研究内容的复现或验证。 文件详解 文件名称:...
-
自然语言需求不一致性检测中ChatGPT初步评估的补充材料
2025年12月23日 30 118 14
数据集概述 本数据集是“利用ChatGPT进行自然语言需求不一致性检测的初步评估”研究的补充材料,包含标注数据与文档,支持对ChatGPT检测需求不一致性能力的验证与分析。 文件详解 文件名称: Inconsistencies-chatGPT.pdf,文件格式: PDF 内容: 包含ChatGPT对需求不一致性检测结果的标注数据,记录模型输出的分析内容...
-
基于语义模式目录的可连接列识别基准数据集_PheKnowLator
2025年12月23日 30 54 1
数据集概述 该数据集是用于评估通过大语言模型(LLMs)识别可连接列的基准数据集,基于PheKnowLator构建,以语义模式目录为核心框架,为相关算法的性能验证提供标准化数据支持。 文件详解 文件名称:PKT benchmark.zip 文件格式:ZIP(压缩包)...
-
软件架构与大语言模型结合系统性文献综述补充材料
2025年12月23日 30 84 82
数据集概述 本数据集是“软件架构与大语言模型结合:大语言模型在软件架构领域的系统性综述”研究的补充材料,包含研究中使用的搜索期刊列表、文献检索结果、筛选后的文献及分析文献的分类信息,为复现或扩展该领域的文献综述研究提供完整数据支持。 文件详解 该数据集为压缩包文件,解压后包含以下内容: - venue-...
-
基于UNSPSC编码的AI库存分类研究数据集
2025年12月22日 30 49 12
数据集概述 本数据集为一项关于利用大语言模型(LLMs)实现库存数据自动化分类的研究资料,以联合国标准产品和服务编码(UNSPSC)为分类框架,评估LLMs在不同场景下的分类准确性与效率,结果显示带上下文提示时LLMs在UNSPSC细分领域准确率可达百分之九十。 文件详解 文件名称: 14125ijnlc02 (2).pdf 文件格式: PDF...
-
ChatGPT与医疗专业人员解答1型糖尿病常见问题对比分析数据集
2025年12月22日 30 13 0
数据集概述 本数据集围绕ChatGPT与医疗专业人员解答1型糖尿病常见问题(FAQs)的对比分析展开,包含英文和阿拉伯语相关的问答内容、调查文件、评估文档及结果数据,为研究AI与专业人员在医疗问答领域的表现差异提供支持。 文件详解 文件名称:FAQ Survey.pdf,文件格式:PDF,内容为1型糖尿病常见问题调查相关文档...
-
大语言模型项目技术债务综合研究数据集
2025年12月22日 30 125 112
数据集概述 本数据集围绕大语言模型(LLM)项目中的技术债务展开综合研究,包含相关研究数据,为分析LLM项目技术债务问题提供数据支持。 文件详解 文件名称:PromptDebt_Data.zip 文件格式:ZIP压缩包 内容说明:该压缩包可能包含大语言模型项目技术债务研究的相关数据文件,具体内容需解压后查看 适用场景...
-
全球牙科教育中AI聊天机器人与大语言模型影响调查数据集2023
2025年12月22日 30 180 153
数据集概述 本数据集收录了2023年5月至6月期间牙科教育工作者对AI工具的认知、知识水平与感知的调查数据,围绕人口统计学特征、使用经验、态度倾向等变量展开,为研究AI对牙科教育的潜在增强作用提供数据支持。 文件详解 文档类文件: 00_README.pdf:PDF格式,提供数据集的基本说明与使用指引...
-
架构侵蚀违规症状自动化识别研究复现包
2025年12月21日 30 54 29
数据集概述 本数据集为架构侵蚀违规症状自动化识别研究的复现包,包含代码审查评论数据、特征文件、预训练词嵌入模型下载链接、实验脚本及开发者调查访谈资料,支持复现机器学习、深度学习及大语言模型分类器实验。 文件详解 该数据集由三个压缩文件构成,具体说明如下: - 数据文件包: data.zip - 内容说明:包含特征文件、预训练词嵌入模型下载链接及标注数据...
-
APRwithLLM_Based_自动程序修复与大语言模型代码操作完整数据
2025年12月21日 30 132 47
数据集概述 该数据集包含一个PDF文件,主题围绕APR(自动程序修复)与LLM(大语言模型)相关的代码操作内容,以文档形式呈现,为研究两者结合的技术应用提供资料支持。 文件详解 文件名称: top_10_code_operations_red_gradient.pdf 文件格式: PDF (.pdf) 文件内容:...
-
ChemGraph计算化学工作流评估数据集
2025年12月21日 30 199 32
数据集概述 该数据集提供脚本、参考数据和评估工具,用于基准测试ChemGraph(基于大语言模型的分子模拟框架)。包含GPT-4o-mini、Claude-3.5-haiku、Qwen2.5-14B、GPT-4o四种模型的输出结果,所有结果与ChemGraph特定版本兼容。 文件详解 核心数据文件:...



