找到3个数据集

标签: AI系统评估

过滤结果
  • 医疗专业人员AI决策支持系统评估问卷

    2025年12月18日 30 3 2

    数据集概述 该数据集包含两份用于评估医疗专业人员AI决策支持系统的问卷,问卷内容与论文《Trustworthy Enough? Evaluation of an AI Decision Support System for Healthcare Professionals》中的评估方法相关,为研究AI系统在医疗场景的应用效果提供工具支持。 文件详解...
    packageimg
  • A_Question_Bank_to_Assess_Inclusive_AI_论文模拟用户研究数据集

    2025年12月15日 30 49 45

    数据集概述 本数据集是论文《A Question Bank to Assess Inclusive AI》的配套模拟用户研究数据,通过GPT-4o创建70个不同领域的虚拟角色,对评估AI包容性的题库进行验证,包含角色详情与题库验证结果两类文件。 文件详解 文件名称:70 Personas.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 人工智能知识测试性能分析参数与表现的关系

    2025年2月24日 90 52 28

    标题:人工智能知识测试性能分析参数与表现的关系 数据内容:该数据集包含了人工智能系统在知识测试中的表现数据,具体包括以下几个数据元素: - 实体(Entity):25种不同的AI系统或模型 - 编码(Code):统一的编码标识 - 年份(Year):5个不同的年份 - MMLU平均值(MMLU avg):25种不同的平均测试成绩 -...
    packageimg