数据集概述
本数据集为suecharo/yevis-getting-started项目的工作流文件集,包含8个文件,覆盖配置文件、工作流定义文件、示例数据文件等类型。核心用途为支持Yevis工作流注册库的构建与维护,可用于工作流元数据生成、验证、测试执行及关联文件上传等操作。
文件详解
- 文档文件
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:描述yevis-cli工具功能,包括生成工作流元数据模板、验证元数据、执行测试、创建GitHub Pull Request、上传文件至Zenodo获取DOI、生成TRS响应等
- 工作流定义文件
- 文件名称:trimming_and_qc.cwl、trimmomatic_pe.cwl、fastqc.cwl
- 文件格式:CWL
- 字段映射介绍:共3个CWL格式的工作流定义文件,用于描述生物信息学分析流程(如质控、修剪等)的执行逻辑
- 配置文件
- 文件名称:yevis-config-1.0.0.yml
- 文件格式:YML
- 字段映射介绍:Yevis工作流的配置文件,版本为1.0.0
- 参数文件
- 文件名称:wf_params.json
- 文件格式:JSON
- 字段映射介绍:包含
fastq_1和fastq_2两个键的JSON结构,用于定义工作流输入参数
- 示例数据文件
- 文件名称:ERR034597_1.small.fq.gz、ERR034597_2.small.fq.gz
- 文件格式:GZ
- 字段映射介绍:2个压缩格式的示例FastQ文件,作为工作流的输入数据示例
数据来源
suecharo/yevis-getting-started
适用场景
- Yevis工作流注册库构建: 用于生成、验证工作流元数据,支持工作流注册库的维护
- 生物信息学工作流测试: 通过示例数据和参数文件,执行工作流测试验证流程正确性
- 工作流工具集成: 利用yevis-cli工具功能,实现与GitHub、Zenodo等平台的集成操作
- 工作流标准化研究: 基于CWL格式的工作流定义文件,研究生物信息学工作流的标准化描述方法