-
模型质量评估_人类评分_提示词_模型及LLM回答数据集
2025年12月19日 30 193 124
数据集概述 该数据集为论文《Assessing Model Quality Using Large Language Models》的配套数据,包含人类评分结果、提示词、模型数据及大语言模型(LLM)回答等内容,用于模型质量评估研究。 文件详解 PDF文档文件(共6个): Results LLM_M1.pdf、Results...
2025年12月19日 30 193 124