TPS022022参考FBC光谱数据集
数据来源:互联网公开数据
标签:FBC光谱,参考基因组,微生物学,基因测序,数据科学,生物信息学
数据概述:
本数据集提供了以下参考基因组的分数碱基含量(FBC)光谱信息,分为两个数据表:
train_ref_fbc_spec.csv包含了10种细菌的FBC光谱数据,具体包括肺炎克雷伯菌(NC_012731.1)、屎肠球菌(LR134297.1)、空肠弯曲菌(NC_002163.1)、肺炎链球菌(NC_003028.3)、肠炎沙门氏菌(NC_003197.2)、金黄色葡萄球菌(NC_007622.1)、大肠杆菌(U00096.3)、化脓链球菌(NC_002737.1)、费罗森大肠杆菌(NC_011740.1)和脆弱拟杆菌(NC_006347.1)。
test_ref_fbc_spec.csv包含了13种细菌的FBC光谱数据,具体包括化脓链球菌MGAS315(AE014074.1)、新港肠炎沙门氏菌(CP006631.1)、耐甲氧西林金黄色葡萄球菌MRSA252(BX571856.1)、屎肠球菌ATCC9790(NC_018081.1)、RM1221空肠弯曲菌(NC_003912.7)、BOB25脆弱拟杆菌(CP011073.1)、EFCF056费罗森大肠杆菌(NZ_CP040805.1)、O157大肠杆菌(AE005174.2)、JJA肺炎链球菌(CP000919.1)、Kp52145肺炎克雷伯菌(FO834906.1)、肠杆菌气单胞菌(NC_015663.1)和结核分枝杆菌(AP018035.1)。
数据用途概述:
该数据集适用于微生物学研究、基因测序分析、生物信息学研究等多种场景。研究人员可以利用此数据进行细菌物种鉴定、基因组学分析、微生物生态学研究;医疗机构可借助数据支持临床诊断和治疗方案制定;教育机构可利用数据进行教育培训,帮助学习者理解微生物学的基本原理和研究方法。