密码子使用数据集

密码子使用数据集 数据来源:互联网公开数据 标签:密码子使用,基因组,生物多样性,生物信息学,分类学,编码DNA,微生物学 数据概述: 本数据集包含了来自CUTG数据库中大量来自不同类群的多样化生物的基因组编码DNA中的密码子使用频率记录。通过对CUTG数据库中细菌(bct)类别的进一步手动整理和重新分类,我们将这些类别分为古菌(arc)、质粒(plm)和细菌(bct')。原始bct'域中的分类通过提取各文件qbxxx.spsum.txt(其中xxx=bct(细菌)、inv(无脊椎动物)、mam(哺乳动物)、pln(植物)、pri(灵长类)、rod(啮齿类)、vrt(脊椎动物))中的不同属名,并按属名进行分类,共包含514个不同的属名。对于这些不同的属类,我们根据需要重新标记为arc(古菌)。在真细菌条目中,我们将细菌基因组(保持原始标签bct')和细菌质粒(现在标记为plm')区分开来。

经过这些预处理步骤,最终的数据集文件包含CUTG数据库中所有qbxxx.spsum.txt条目的合并文本文件。如前所述,qbbct.spsum.txt条目被分为bct'(真细菌)、plm'(质粒)和arc(古菌),这是CUTG数据库中原本未作区分的。

数据用途概述: 该数据集适用于密码子使用频率分析、生物信息学研究、基因组学研究、微生物学研究等多种场景。研究人员可以利用此数据进行不同生物类群间密码子使用模式的比较;生物信息学家可以研究不同生物体内的密码子偏好性;微生物学家可以分析细菌和古菌中的密码子使用差异。此外,该数据集也适合用于教育培训,帮助学习者理解密码子在不同生物中的使用情况和规律。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 15:16 (UTC)
创建于 四月 14, 2025, 15:16 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。