数据集概述
本数据集包含考古(Oncorhynchus属)与现代(Salmo salar)鱼类骨胶原的MALDI-TOF质谱数据及相关序列信息,含样本信息CSV、质谱文本文件压缩包、胶原序列比对FASTA及注释GFF文件,共6个文件,用于生物考古领域的物种鉴定与胶原特征分析。
文件详解
- 样本信息文件
- 文件名称:file-information.csv
- 文件格式:CSV
- 字段映射介绍:包含Lot Number (York)、Sample ID (Archeological)、Species、Common Name、MALDI Spectra Averaged Uploaded to Zonodo等字段,关联样本物种信息与质谱文件
- 质谱数据压缩包
- 文件名称:maldi-data.zip
- 文件格式:ZIP
- 内容说明:包含Bruker Ultraflex II仪器采集的m/z 800-3500范围质谱数据,经mMass平均后的3次技术重复,以制表符分隔的TXT文件存储
- 序列比对文件
- 文件名称:Collagen-sequence-alignment.fasta
- 文件格式:FASTA
- 内容说明:包含牛参考胶原序列及Salmo salar、O. mykiss的COL1A1、COL1A2、COL1A3序列(牛为COL1A1、COL1A2、COL1A1)的比对结果
- 注释文件
- 文件名称:Ssalar_COL1A1_annotated.gff、Ssalar_COL1A2_annotated.gff、Ssalar_COL1A3_annotated.gff
- 文件格式:GFF
- 内容说明:共3个文件,对应Salmo salar版本1的COL1A1、COL1A2、COL1A3胶原蛋白序列,注释已发表哺乳动物标记及本研究提出的生物标志物位置
适用场景
- 生物考古物种鉴定:通过骨胶原质谱特征区分考古鱼类与现代鱼类样本
- 胶原序列进化分析:对比不同物种胶原序列(COL1A1/COL1A2/COL1A3)的差异与保守区域
- 质谱生物标志物开发:基于注释GFF文件挖掘鱼类骨胶原的特异性质谱标志物
- 考古样本溯源研究:结合样本信息与质谱数据,分析考古鱼类样本的物种归属与年代特征