数据集概述
本数据集是Galaxy Training Network中JBrowse基因组数据可视化教程的配套数据,包含10个不同类型的基因组相关文件,覆盖DNA测序、RNA-Seq、基因注释、变异数据等内容,用于支持JBrowse工具的可视化操作训练与实践。
文件详解
- 基因组序列文件
- 文件名称:
genome.fa
- 文件格式:FA
- 字段映射介绍:包含参考基因组的序列信息
- DNA测序相关文件
- 文件名称:
dna sequencing coverage.bw、dna sequencing.bam
- 文件格式:BW、BAM
- 字段映射介绍:分别为DNA测序覆盖度数据(BW格式)和DNA测序比对结果(BAM格式)
- RNA-Seq覆盖度文件
- 文件名称:
RNA-Seq coverage 1.bw、RNA-Seq coverage 2.bw
- 文件格式:BW
- 字段映射介绍:两组RNA-Seq数据的覆盖度信息
- 基因注释文件
- 文件名称:
blastp genes.gff3、genes (NCBI).gff3、genes (de novo).gff3
- 文件格式:GFF3
- 字段映射介绍:包含不同来源的基因注释信息,分别为blastp预测基因、NCBI参考基因、从头预测基因
- 变异数据文件
- 文件名称:
variants.vcf
- 文件格式:VCF
- 字段映射介绍:基因组变异位点信息
- 比对结果文件
- 文件名称:
blastp vs swissprot.xml
- 文件格式:XML
- 字段映射介绍:blastp与SwissProt数据库的比对结果
数据来源
Galaxy Training Network
适用场景
- 生物信息学工具训练:用于JBrowse基因组数据可视化工具的操作教学与实践
- 基因组数据可视化实践:支持不同类型基因组数据在JBrowse中的可视化展示练习
- 基因组数据分析教学:辅助理解DNA测序、RNA-Seq、基因注释等数据的可视化呈现方式
- 生物信息学教程开发:作为基因组数据可视化相关教程的配套示例数据