COVID-19病毒DNA序列分类预测数据集-pushkar007

COVID-19病毒DNA序列分类预测数据集-pushkar007 数据来源:互联网公开数据 标签:COVID-19,病毒DNA,序列预测,分类模型,机器学习,深度学习,科研,生物信息学

数据概述: 本数据集来源于COVID-DeepPredictor项目,包含用于预测SARS-CoV-2及其他病原病毒的递归神经网络模型所需的训练和评估数据。数据集包括COVID-19病毒的DNA序列及其分类信息。训练数据和评估数据分别用于模型的训练和性能评估。测试数据被分为5折,分布不均,其中一份用于验证。

数据集结构包括以下字段:

PID:病毒DNA的唯一标识符 CLASS:分配给该类型病毒的类别编号 CLASSNAME:病毒的具体类别名称 SEQ:病毒DNA的序列

数据用途概述: 该数据集适用于病毒分类预测、机器学习模型训练与评估等场景。用户可以利用此数据集训练和测试各种分类模型,如随机森林、K近邻、逻辑回归、朴素贝叶斯等。数据集中还展示了使用Transformer(DNA-BERT)模型的示例代码。通过分析病毒DNA序列,研究人员可以实现对病毒类型的准确分类,为病毒预测和防控提供科学依据。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 00:29 (UTC)
创建于 五月 31, 2025, 00:29 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。