数据集概述
本数据集是发布于Open Germline Receptor Database(OGRDB)的人类IGH_VDJ免疫受体种系参考集,包含7个文件,涵盖FASTA格式的序列文件、JSON格式的元数据文件及许可说明文件,为免疫受体相关研究提供标准化参考数据。
文件详解
- 许可文件
- 文件名称:licence.txt
- 文件格式:TXT
- 字段映射介绍:包含数据的许可声明,标注采用Creative Commons CC0 1.0许可协议
- 序列文件(FASTA格式)
- 文件名称:Homo_sapiens_IGH_VDJ_rev_9_ungapped_extended.fasta、Homo_sapiens_IGH_VDJ_rev_9_gapped.fasta、Homo_sapiens_IGH_VDJ_rev_9_ungapped.fasta、Homo_sapiens_IGH_VDJ_rev_9_gapped_extended.fasta
- 文件格式:FASTA
- 字段映射介绍:包含人类IGH_VDJ受体种系的序列数据,分为带间隙(gapped)、无间隙(ungapped)及扩展(extended)等不同版本
- 元数据文件(JSON格式)
- 文件名称:Homo_sapiens_IGH_VDJ_rev_9.json、Homo_sapiens_IGH_VDJ_rev_9_extended.json
- 文件格式:JSON
- 字段映射介绍:包含对应序列文件的元数据信息,可能涉及序列注释、版本信息等结构化数据
数据来源
Open Germline Receptor Database (OGRDB)
适用场景
- 免疫受体研究:用于人类IGH_VDJ免疫受体种系序列的参考与比对分析
- 生物信息学分析:支持免疫组库测序数据的注释、标准化处理及变异检测
- 抗体工程研究:为抗体分子设计、改造提供种系序列的基础参考数据
- 免疫遗传学研究:分析人类免疫受体种系的多样性及进化特征