数据集概述
本数据集是发布于Open Germline Receptor Database(OGRDB)的小鼠PWD/PhJ品系免疫球蛋白轻链可变区(IGLV)基因种系参考集,包含2个FASTA格式基因序列文件、1个JSON格式数据文件及1个许可证文件,共计4个文件,为免疫球蛋白受体基因研究提供标准化参考数据。
文件详解
- 基因序列文件(FASTA格式)
- 文件名称:PhJ IGLV_rev_1_gapped.fasta、PhJ IGLV_rev_1_ungapped.fasta
- 文件格式:FASTA
- 字段映射介绍:包含小鼠PWD/PhJ品系IGLV基因的种系参考序列,其中gapped版本含基因间隙信息,ungapped版本为连续序列
- 数据描述文件(JSON格式)
- 文件名称:PhJ IGLV_rev_1.json
- 文件格式:JSON
- 字段映射介绍:预计包含基因集的元数据、序列注释或结构信息(具体字段未提供详细映射)
- 许可证文件(TXT格式)
- 文件名称:licence.txt
- 文件格式:TXT
- 字段映射介绍:记录数据集的使用许可信息,明确采用Creative Commons CC0 1.0协议发布
数据来源
Open Germline Receptor Database(OGRDB)
适用场景
- 免疫球蛋白基因进化研究:分析小鼠PWD/PhJ品系IGLV基因的种系特征与进化规律
- 基因序列比对参考:作为标准化参考集,用于免疫球蛋白受体基因序列的比对与注释
- 生物信息数据库构建:为免疫球蛋白受体基因相关数据库提供小鼠品系特异性参考数据
- 基因功能注释分析:结合JSON文件元数据,解析IGLV基因的结构与功能关联