-
TiLt_HS_Based_立陶宛高中多学科选择题测试数据_2024
2026年1月26日 30 113 16
数据集概述 本数据集为TiLt-HS(立陶宛高中测试),包含立陶宛高中多学科选择题测试数据,用于评估学生知识水平。数据采集于2024年8月,涵盖微观经济学、宏观经济学、财务与簿记三个学术主题,共142个测试问题,可作为多语言模型训练子集使用。 文件详解 文件名称:high_school_economics_lt.json 文件格式:JSON...
-
Step1_Co_planning_Deaf受访者糖尿病答题正确性分析数据
2026年1月21日 30 120 75
数据集概述 本数据集是共同规划阶段针对听力障碍受访者开展的额外研究的第一步分析数据,聚焦于糖尿病不同主题的答题正确性。包含27份文档文件,记录受访者对糖尿病相关问题的回答情况,为研究听力障碍群体的糖尿病知识认知提供基础数据。 文件详解 文档文件(document_files) 文件名称:遵循“Checklist of answers_...
-
Pilot3_Game_Scenarios_CROSSCULT社会科学实验游戏内容数据
2026年1月14日 30 66 43
数据集概述 本数据集包含CROSSCULT社会科学专家为参与Pilot 3实验的用户开发的游戏场景内容信息,主要涵盖实验预访问体验中测验环节的问题与答案详情。数据均从Pilot 3游戏内容中提取,以XML文件形式存储,总大小约几千字节,包含2个文件。 文件详解 文件名称:Game1.xlsx、Game2.xlsx 文件格式:XLSX...
-
Public_MapReadingTest_ELTE实验制图研究组多语言地图阅读测试公开数据2015_2022
2025年12月28日 30 2 1
数据集概述 本数据集是Eötvös Loránd University实验制图研究组开展的多语言地图阅读研究的公开数据库,包含2015年秋至2022年4月收集的过滤后数据。原始805条记录经筛选(排除未完成测试及耗时异常样本)后得到511条有效记录,以Excel文件存储,含3个工作表。 文件详解...
-
巴西中等教育考试问题数据集2010_2022
2025年12月23日 30 52 7
数据集概述 该数据集提取自巴西国家教育研究所(INEP)网站公开的ENEM考试试题,覆盖2010至2022年。数据包含考试题目文本、选项列表、年份、学科领域及正确答案,通过脚本处理PDF文件生成,为研究巴西中等教育考试内容提供结构化数据支持。 文件详解 文件名称: enem_questions.zip 文件格式: ZIP压缩包 核心字段映射:...
-
数据叙事对信息回忆能力影响的辅助材料
2025年12月19日 30 121 13
数据集概述 本数据集为CHIIR 2022论文《数据叙事对信息回忆能力的影响》的辅助材料,包含实验所用的可视化材料及参与者问题与答案,支持探究数据叙事与传统可视化对信息回忆的差异。 文件详解 可视化材料文件(PDF格式,共3个): falsetto-side-by-side.pdf:实验用对比可视化文件 homicide-side-by-...
-
LLM一致性测试组合测试用例数据集
2025年12月18日 30 71 66
数据集概述 该数据集是用于大语言模型(LLM)一致性测试的组合测试用例集合,包含问题、同义词列表、覆盖数组、测试运行记录、模型输出及性能评估结果,支持分析Starling-LM、Llama系列等6个模型的响应一致性与准确性。 文件详解 核心问题文件:...
-
聊天机器人数学与逻辑问题测试数据集2023
2025年12月15日 30 175 150
数据集概述 本数据集包含2023年5月针对ChatGPT-3.5、ChatGPT-4和Google Bard的30道数学与逻辑问题测试内容,含问题文本、正确答案、解答说明及270条聊天机器人回答,分原创(Set A)和公开(Set B)两类问题,为对比评估聊天机器人逻辑推理能力提供数据支持。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: -...
-
休闲领域复杂已知项搜索请求标注指南与数据集
2025年12月14日 30 25 7
数据集概述 本数据集包含休闲领域(书籍、电影、游戏)的已知项搜索请求标注数据,标注内容包括搜索请求帖、正确答案帖及原帖主确认帖,同时提供标注流程说明文档,支持相关检索研究。 文件详解 标注指南文件: 文件名称:Annotation_Guidelines.pdf 文件格式:PDF 内容:详细说明已知项搜索请求的标注流程与规则...
-
MuChoMusic音乐理解多模态评估数据集
2025年12月5日 30 169 85
数据集概述 该数据集是评估音频-语言多模态模型音乐理解能力的基准数据集,包含一千一百八十七道经人工验证的多选题,基于六百四十四首来自公开音乐数据集的曲目,覆盖多种音乐流派,用于测试模型对音乐概念及文化、功能语境的知识与推理能力。 文件详解 文件名称: muchomusic.csv 文件格式: CSV 字段映射:...
-
语言模型对比数据集
2025年4月15日 30 150 111
语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1...



