Ooh_Na_Na_术语定义数据集

数据集概述

本数据集为Ooh Na Na Definitions的术语定义数据,包含以TSV格式存储的前缀-标识符-定义字符串,采用Python CSV模块引用格式。数据包含元数据、样本数据、摘要数据及压缩数据,共四个文件,可用于术语定义查询与标准化处理。

文件详解

  • 文件名称:definitions_metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含version(版本)、git_hash(Git哈希值)、date(日期)、count(计数)四个键值对的元数据信息。
  • 文件名称:definitions_sample.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含prefix(前缀)、identifier(标识符)、definition(定义)三个字段的术语定义样本数据。
  • 文件名称:definitions_summary.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含不同数据库来源(如ncbigene、mgi、pr等)的标识符统计数据。
  • 文件名称:definitions.tsv.gz
  • 文件格式:TSV.GZ
  • 字段映射介绍:压缩格式的完整术语定义数据文件,包含前缀-标识符-定义字符串。

适用场景

  • 术语标准化研究: 用于分析不同数据库术语的前缀、标识符及定义的标准化情况。
  • 数据集成与映射: 支持跨数据库的术语映射与数据集成工作。
  • 术语查询工具开发: 为术语定义查询工具提供基础数据支持。
  • 元数据分析: 通过元数据文件分析数据集的版本、生成日期等信息。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 311.77 MiB
最后更新 2026年2月15日
创建于 2026年2月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。