数据集概述
本数据集是Bakta基因组注释工具的测试数据库,用于验证Galaxy包装器相关的数据管理功能。数据集包含三个文件,以压缩包和JSON文件为主,无数据库完整文件,仅提供测试所需的核心数据结构与版本信息。
文件详解
- 核心文件列表
- 文件名称:db-versions.json
- 文件格式:JSON
- 字段映射介绍:数组结构(长度为3),每条记录包含date(日期)、major(主版本号)、minor(次版本号)、doi(数字对象标识符)、record(记录编号)、md5(校验码)、software-min(最低兼容软件版本,含major和minor字段)等信息
- 文件名称:db.tar.gz
- 文件格式:GZ压缩包
- 字段映射介绍:Bakta数据库完整压缩包(测试用)
- 文件名称:db-light.tar.gz
- 文件格式:GZ压缩包
- 字段映射介绍:Bakta轻量数据库压缩包(测试用)
适用场景
- Galaxy包装器测试: 验证Bakta数据管理器在Galaxy平台的功能兼容性与稳定性
- 生物信息学工具集成: 支持Bakta基因组注释工具与Galaxy工作流的对接测试
- 数据库版本管理验证: 利用db-versions.json测试数据库版本的解析、匹配与更新逻辑
- 压缩包处理功能测试: 验证Galaxy对.gz格式数据库压缩包的读取与解压能力