数据集概述
该数据集是一个人工整理的开放获取分子参考数据库(DROP),用于果蝇寄生蜂的鉴定。数据库将遗传数据与凭证标本关联,部分标本经分类学家鉴定并与原始模式标本比对,同时包含更新的物种目录,旨在解决果蝇寄生蜂鉴定难题,促进相关研究。
文件详解
- 说明文档:
- README.md:Markdown格式的说明文档,包含数据库引用信息、背景介绍及使用指南。
- DROP_tables_field_description.xlsx:Excel格式文件,说明数据库各表的字段描述。
- generate_all_csv_tables_and_fasta_files.txt:文本文件,包含生成CSV表和FASTA文件的操作代码。
- DROP_table_relationships.jpg:图片文件,展示数据库表之间的关系。
- 数据文件:
- DROP.sqlite3:SQLite3数据库文件,存储数据集的结构化数据。
- DROP_Strains.csv、DROP_Transcriptomes.csv、DROP_megatable.csv、DROP_Genomes.csv、DROP_Species_catalog.csv:CSV格式文件,分别包含菌株、转录组、综合表、基因组、物种目录等数据。
- DROP_sequences_fasta_COI_only.fas、DROP_sequences_fasta_COI_only_Chalcidoidea.fas等:FASTA格式文件,包含不同类群的COI基因序列数据。
适用场景
- 生物学研究:用于果蝇寄生蜂的分子鉴定,支持物种分类与多样性研究。
- 基因与基因组分析:基于COI基因序列、转录组和基因组数据开展相关研究。
- 实验设计:为果蝇寄生蜂相关实验提供训练数据或参考序列。
- 数据库构建参考:为其他生物类群的分子鉴定数据库构建提供范例。