数据集概述
本数据集提供BeetRepeats参考序列资源,包含甜菜及近缘种(Beta、Patellifolia属等)所有已鉴定重复序列家族的综合汇编,涵盖卫星DNA、核糖体DNA、转座元件等类型。同时提供该重复序列在EL10、2320BvONT_v1.0、RefBeet1.5三个甜菜基因组组装中的注释结果,适用于RepeatMasker等工具进行重复序列注释与多态性检测。
文件详解
- 参考序列文件
- 文件名称:BeetRepeatDB_v1.0.fasta
- 文件格式:FASTA
- 字段映射介绍:包含甜菜及近缘种所有已鉴定重复序列家族的参考序列,序列类型涵盖卫星DNA、核糖体DNA、转座元件和内源病毒等。
- 基因组注释文件
- 文件名称:BeetRepeatDB_v1.0_at_EL10.gff、BeetRepeatDB_v1.0_at_2320BvONT_v1.0.gff、BeetRepeatDB_v1.0_at_RefBeet1.5.gff
- 文件格式:GFF
- 字段映射介绍:分别对应EL10、2320BvONT_v1.0、RefBeet1.5三个甜菜基因组组装中重复序列的注释结果,包含重复序列在基因组中的位置、类型等注释信息。
- 内容说明文件
- 文件名称:BeetRepeatDB_v1.0-Content.docx
- 文件格式:DOCX
- 字段映射介绍:包含所有重复序列家族的详细列表及对应参考文献,说明数据集的内容构成。
数据来源
BeetRepeats资源库(对应论文:McGrath JM等2023、Sielemann K等2023)
适用场景
- 甜菜基因组重复序列注释:利用FASTA参考序列与GFF注释文件,完成甜菜基因组组装的重复序列区域识别与分类。
- 重复序列多态性检测:基于参考序列资源,分析甜菜及近缘种群体中重复序列的变异特征。
- 基因组结构分析:通过重复序列分布规律,研究甜菜基因组的结构组成与进化机制。
- 分子标记开发:基于重复序列的特异性,开发甜菜遗传多样性分析或分子育种用的分子标记。
- 比较基因组学研究:对比不同甜菜基因组组装中重复序列的分布差异,探究基因组进化动态。