数据集概述
本数据集为Cellosaurus第49版发布的完整文件集,包含11个文件,涵盖细胞系数据库的核心数据文件、参考文档、配置文件等,涉及细胞系信息、参考文献、常见问题、命名冲突等内容,是生物医学领域细胞系研究的基础数据库资源。
文件详解
- 核心数据文件
- 文件名称:cellosaurus.xml
- 文件格式:XML
- 字段映射介绍:细胞系数据库核心数据文件,包含细胞系的结构化信息
- 配置与标准文件
- 文件名称:cellosaurus.xsd
- 文件格式:XSD
- 字段映射介绍:XML Schema定义文件,用于规范cellosaurus.xml的结构
- 参考文档类文件(TXT格式,共8个)
- 文件名称:cellosaurus_refs.txt、cellosaurus_faq.txt、cellosaurus_name_conflicts.txt、cellopub.txt、cellosaurus_deleted_ACs.txt、cellosaurus_relnotes.txt、cellosaurus_xrefs.txt
- 文件格式:TXT
- 字段映射介绍:分别包含参考文献、常见问题、命名冲突记录、相关出版物、已删除访问码、版本说明、交叉引用等文本信息
- 本体文件
- 文件名称:cellosaurus.obo
- 文件格式:OBO
- 字段映射介绍:细胞系本体文件,用于标准化细胞系相关术语
数据来源
CALIPHO group at the SIB - Swiss Institute of Bioinformatics(瑞士生物信息学研究所CALIPHO研究组)
适用场景
- 细胞系研究:用于查询、验证细胞系的基本信息、来源及相关文献
- 生物医学数据库构建:作为细胞系数据库的基础数据资源,支持相关数据库的开发与整合
- 细胞系命名规范研究:通过命名冲突文件分析细胞系命名问题,推动命名标准化
- 生物信息学分析:利用XML结构化数据进行细胞系相关的生物信息学挖掘与分析