CORD-19问答内容数据集-davidmezzetti

CORD-19问答内容数据集-davidmezzetti

数据来源:互联网公开数据

标签:CORD-19,问答系统,自然语言处理,机器学习,数据集,Transformer模型,高能研究

数据概述: 本数据集包含用于构建CORD-19数据集问答模型的各类文件。数据集包括以下文件: - cord19.txt:CORD-19数据的逐行导出,重点关注高质量且检测到研究设计的文章。 - cord19-qa.csv:包含CORD-19数据集中问题、上下文、答案组合的CSV行。 - cord19-qa.json:以SQuAD 2.0格式组织的CORD-19数据集中问题、上下文、答案组合。

数据集中的Transformer模型经过语言建模、SQuAD 2.0和本数据集的微调,可以在HuggingFace Transformers中使用。

数据用途概述: 该数据集适用于问答系统的构建和评估、自然语言处理研究、机器学习模型训练等多种场景。研究人员可以利用此数据集训练和优化问答模型,以提高其在处理科学研究文献中的问题回答能力。教育和培训机构可以使用该数据集作为教学资源,帮助学习者掌握问答系统的设计和实现方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 7.03 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。