Ooh_Na_Na_OBO_Foundry替代标识符提取数据

数据集概述

本数据集为从OBO Foundry提取的替代标识符集合,包含前缀、主标识符和替代标识符三类信息,以TSV格式存储。数据集由pyobo工具生成,包含元数据、样本、摘要及压缩数据文件,可用于生物信息学领域的标识符映射与标准化研究。

文件详解

  • 数据文件
  • 文件名称:alts.tsv.gz
  • 文件格式:gz压缩TSV
  • 字段映射介绍:包含三列核心数据,分别为prefixes(前缀)、primary identifiers(主标识符)、alt identifiers(替代标识符)
  • 文件名称:alts_sample.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含三列数据,分别为prefix(前缀)、identifier(主标识符)、alt(替代标识符),示例数据包含aeo等前缀的标识符映射
  • 文件名称:alts_summary.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含各前缀对应的标识符数量统计,如ncbitaxon、zfin、chebi等
  • 元数据文件
  • 文件名称:alts_metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含version(版本)、git_hash(Git哈希值)、date(日期)、count(计数)四个字段

数据来源

由pyobo工具从OBO Foundry提取生成

适用场景

  • 生物信息学标识符映射: 用于不同数据库或本体之间的标识符匹配与转换
  • 生物数据标准化: 支持生物医学数据的统一标识和整合分析
  • 本体数据管理: 辅助OBO Foundry本体资源的维护与更新
  • 生物信息工具开发: 为生物信息学软件提供标识符映射的基础数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.65 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。