数据集概述
本数据集基于北美鸣禽24份血液样本的宏转录组测序,针对低强度、多物种感染的血液寄生虫(血孢子虫)开展研究。通过分离宿主与寄生虫转录本并分配至血孢子虫属,提供33个系统发育多样化的血孢子虫线粒体谱系的1,502个单拷贝直系同源基因座数据,可支持寄生虫进化与感染检测研究。
文件详解
- 文档类文件
- 文件名称:README_for_contamfinder_output.txt、README_for_genus_assignment_51pct_cutoff_output.txt、README_for_genus_assignment_output_RAxML_gene_trees.txt
- 文件格式:TXT
- 字段映射介绍:分别说明contamfinder输出、51% cutoff属分配输出、RAxML基因树属分配输出的相关信息
- 代码文件
- 文件名称:Galen_2019_R_code.R
- 文件格式:R
- 字段映射介绍:研究中使用的R代码文件,用于数据分析处理
- 附录文件
- 文件名称:All_Appendices.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含研究相关的所有附录内容
- 压缩文件
- 文件名称:contamfinder_output.zip、genus_assignment_output_RAxML_gene_trees.zip、genus_assignment_51pct_cutoff_output.zip
- 文件格式:ZIP
- 字段映射介绍:分别压缩存储contamfinder输出、RAxML基因树属分配输出、51% cutoff属分配输出的相关数据
- 正交群文件
- 文件名称:orthogroup_pres_ab.txt
- 文件格式:TXT
- 字段映射介绍:包含正交群存在-缺失信息,涉及多个OG编号(如OG5_153764等)
数据来源
论文“Metatranscriptomics yields new genomic resources and sensitive detection of infections for diverse blood parasites”
适用场景
- 寄生虫基因组资源研究: 利用宏转录组数据获取血孢子虫蛋白编码基因库,加速基因组资源开发
- 寄生虫感染检测: 对比显微镜和DNA条形码技术,分析宏转录组对低强度、多物种感染的检测敏感性
- 寄生虫进化与多样性研究: 通过单拷贝直系同源基因座数据,探究血孢子虫的系统发育与进化关系
- 感染强度与基因数据量关联分析: 研究不同感染强度下可获取的基因座数量变化规律
- 生物信息学方法应用: 验证宏转录组在多物种寄生虫感染研究中的技术可行性与优势