SPIKE-QA问答数据集

SPIKE-QA问答数据集 数据来源:互联网公开数据 标签:问答数据集,GPT4o-small,零样本学习,基础科学,复杂问题,日常聊天,Excel,CSV 数据概述: SPIKE-QA问答数据集是由GPT4o-small模型生成的人工标注问答数据集,包含50,236个独立的问答样本,涉及的主题从基础科学(如物理、化学、数学)到复杂的生成问题或日常对话。数据集以Excel表格和CSV文件的形式提供,每个表格包含“问题”和“答案”两个字段,完整的CSV文件名为SPIKE-QA.csv。 数据用途概述: 尽管数据集规模可能不足以从头开始预训练大规模语言模型(SLM),但可用于参数调优。通过对数据集进行改写,可以将其转化为更有价值的资源。由于其多样性和样本长度的差异,该数据集也适用于模型评估。最重要的是,数据集以CSV格式提供,便于初学者练习和使用。 版权说明: 数据集版权归作者所有(ORCID:0009-0002-1449-2803)。数据集的DOI替代标识符为10.5281/zenodo.14584015。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 12:31 (UTC)
创建于 四月 15, 2025, 12:30 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。