-
大语言模型系统建模任务能力评估与改进数据集
2025年12月20日 30 17 7
数据集概述 该数据集包含用于系统评估大语言模型(LLMs)能力的测试套件及执行结果,核心内容为LLMs基于自然语言生成XMI格式有效UML模型的相关数据,支持研究模型建模任务表现及改进方向。 文件详解 文档类文件: README.md:Markdown格式,说明数据集目标、作者及文件结构...
-
LLM科学假测试数据集
2025年4月14日 30 128 100
LLM科学假测试数据集 数据来源:互联网公开数据 标签:LLM,科学测试,假数据,数据增强,性能评估,本地测试,运行时优化 数据概述:...



