数据集概述
本数据集基于17,115个水稻转录组RNA-seq文库,覆盖24个稻属物种及51个国家样本,通过从头组装和同源性方法鉴定出810个完整或近完整病毒,包括276种已知病毒和534种新型病毒。数据还包含病毒分类注释及与水稻密切相关的427种病毒筛选结果,为水稻病毒病防控提供新见解。
文件详解
- 压缩文件(Archive files)
- 文件名称:SRA_TSA_Metadata_from_other_species.rar
- 文件格式:RAR
- 字段映射介绍:包含来自其他物种的SRA(Sequence Read Archive)和TSA(Transcriptome Shotgun Assembly)元数据信息
- 文件名称:Alignments_for_phylogenies.rar
- 文件格式:RAR
- 字段映射介绍:用于系统发育分析的序列比对数据
- 文件名称:Viral_nucleotide_sequences.rar
- 文件格式:RAR
- 字段映射介绍:病毒核苷酸序列数据
- 数据文件(Data files)
- 文件名称:Viral_sequences_classification_annonation.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含病毒序列的分类和注释信息,涉及物种分类等生物学关键词
数据来源
论文“In-depth Analysis of 17,115 Rice Transcriptomes Reveals Extensive Viral Diversity in Rice Plants”
适用场景
- 水稻病毒多样性研究:分析水稻转录组中已知及新型病毒的分布与特征
- 病毒分类学研究:基于分类注释数据探索病毒新分类阶元(如新目、科、属)
- 病毒系统发育分析:利用序列比对数据构建病毒进化树,研究病毒演化关系
- 水稻病毒病防控:筛选与水稻密切相关的病毒,为病毒病预防和控制提供数据支持
- 生物信息学方法应用:验证从头组装、同源性分析等方法在病毒鉴定中的有效性