GTN_Training_Galaxy平台ENA数据上传教程训练数据

数据集概述

本数据集是Zenodo.3732359数据的子集,用于Galaxy培训网络(GTN)的“Upload data to ENA”教程。已按指定流程移除人类序列痕迹,包含基于Illumina PE数据生成的SARS-CoV-2共识序列及相关原始数据,共8个文件。

文件详解

  • 数据文件
  • 文件名称:metadata_template_ERC000033_mock_complete.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:ENA数据上传用元数据模板文件
  • 文件名称:SRR10903402_2.fastq.gz、SRR10903401_1.fastq.gz、SRR10903401_2.fastq.gz、SRR10902284_ONT.fq.gz、SRR10903402_1.fastq.gz
  • 文件格式:GZ压缩文件
  • 字段映射介绍:包含Illumina PE数据、ONT数据的测序原始数据文件
  • 文件名称:SRR10903402.fasta、SRR10903401.fasta
  • 文件格式:FASTA
  • 字段映射介绍:基于Illumina PE数据生成的SARS-CoV-2共识序列文件

数据来源

Zenodo.3732359数据集子集(用于Galaxy Training Network教程)

适用场景

  • Galaxy平台教程实践: 用于“Upload data to ENA”教程的操作训练,学习ENA数据上传流程
  • 生物信息学数据处理教学: 作为序列数据处理、共识序列生成的教学示例数据
  • ENA元数据填写练习: 借助metadata_template文件练习ENA上传元数据的规范填写
  • 测序数据格式认知: 帮助学习者熟悉FASTQ、FASTA等生物信息学常用文件格式及压缩格式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 113.41 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。