找到2个数据集

标签: LLM性能测试

过滤结果
  • 大语言模型系统建模任务能力评估与改进数据集

    2025年12月20日 30 17 7

    数据集概述 该数据集包含用于系统评估大语言模型(LLMs)能力的测试套件及执行结果,核心内容为LLMs基于自然语言生成XMI格式有效UML模型的相关数据,支持研究模型建模任务表现及改进方向。 文件详解 文档类文件: README.md:Markdown格式,说明数据集目标、作者及文件结构...
    packageimg
  • LLM科学假测试数据集

    2025年4月14日 30 128 100

    LLM科学假测试数据集 数据来源:互联网公开数据 标签:LLM,科学测试,假数据,数据增强,性能评估,本地测试,运行时优化 数据概述:...
    packageimg