数据集概述
本数据集是Zenodo.3732359数据的子集,用于Galaxy培训网络(GTN)的“Upload data to ENA”教程。已按指定流程移除人类序列痕迹,包含基于Illumina PE数据生成的SARS-CoV-2共识序列及相关原始数据,共8个文件。
文件详解
- 数据文件
- 文件名称:metadata_template_ERC000033_mock_complete.xlsx
- 文件格式:XLSX
- 字段映射介绍:ENA数据上传用元数据模板文件
- 文件名称:SRR10903402_2.fastq.gz、SRR10903401_1.fastq.gz、SRR10903401_2.fastq.gz、SRR10902284_ONT.fq.gz、SRR10903402_1.fastq.gz
- 文件格式:GZ压缩文件
- 字段映射介绍:包含Illumina PE数据、ONT数据的测序原始数据文件
- 文件名称:SRR10903402.fasta、SRR10903401.fasta
- 文件格式:FASTA
- 字段映射介绍:基于Illumina PE数据生成的SARS-CoV-2共识序列文件
数据来源
Zenodo.3732359数据集子集(用于Galaxy Training Network教程)
适用场景
- Galaxy平台教程实践: 用于“Upload data to ENA”教程的操作训练,学习ENA数据上传流程
- 生物信息学数据处理教学: 作为序列数据处理、共识序列生成的教学示例数据
- ENA元数据填写练习: 借助metadata_template文件练习ENA上传元数据的规范填写
- 测序数据格式认知: 帮助学习者熟悉FASTQ、FASTA等生物信息学常用文件格式及压缩格式