-
预测结果混淆矩阵数据集-georgz
预测结果混淆矩阵数据集-georgz 数据来源:互联网公开数据 标签:机器学习,混淆矩阵,预测结果,模型评估,数据集,分类任务,数据分析,模型性能 数据概述:该数据集包含了机器学习模型预测结果的混淆矩阵数据,用于评估模型在分类任务中的性能。主要特征如下: 时间跨度:数据记录的时间范围取决于模型的训练和测试过程。... -
-
语言模型对比数据集
语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1... -
泰坦尼克号公开排行榜数据集
泰坦尼克号公开排行榜数据集 数据来源:互联网公开数据 标签:泰坦尼克号,公开排行榜,机器学习,数据竞赛,模型性能,历史数据 数据概述: 本数据集包含用于撰写《泰坦尼克号排行榜:得分超过0.8为优秀》笔记的数据。文件titanic-... -
-
人工智能模型性能与训练计算的数据集
标题:人工智能模型性能与训练计算的数据集 数据内容: 该数据集包含关于人工智能模型在知识测试与培训计算方面的性能表现。具体包括以下数据元素: - 实体(Entity):表示测试的模型或技术的名称或标识,共有25种不同的值。 - 代码(Code):表示模型或技术的唯一标识符,共有1种值。 - 年份(Year):表示数据收集的年份,共有5种不同的值。 -... -
人工智能知识测试性能分析参数与表现的关系
标题:人工智能知识测试性能分析参数与表现的关系 数据内容:该数据集包含了人工智能系统在知识测试中的表现数据,具体包括以下几个数据元素: - 实体(Entity):25种不同的AI系统或模型 - 编码(Code):统一的编码标识 - 年份(Year):5个不同的年份 - MMLU平均值(MMLU avg):25种不同的平均测试成绩 -... -
人工智能模型性能与数据规模关系研究数据集
标题:人工智能模型性能与数据规模关系研究数据集 数据内容: 该数据集包含了人工智能模型在知识测试任务中的性能表现及其与训练数据集大小之间的关系。数据集中的关键数据元素包括: 1. Entity:表示不同的人工智能模型或算法类型,共有25种不同的值。 2. Code:表示数据集的标识符或版本信息,仅有一种不同的值。 3....