陆地棉双向最佳比对与OMA同源基因比较数据集

数据集概述

本数据集为论文“Homoeolog inference methods requiring bidirectional best hits or synteny miss many pairs”的配套数据,包含陆地棉(Gossypium hirsutum)基于双向最佳比对(BBH)和OMA方法的同源基因比较结果,涉及同源基因对特征、表达量、GO富集等多维度数据。

文件详解

该数据集包含9个文件,具体说明如下: - 同源基因数据文件: - hom_df.csv: CSV格式,含OMA推断的所有同源基因对(32426对),字段包括进化距离等特征 - hom_df_with_synteny_scores.csv: CSV格式,含可计算共线性得分的同源基因对(31901对),字段包括BBH类别、共线性得分、进化距离等 - gene_centric_df.csv: CSV格式,非冗余的基因中心数据框,含表达量及其他指标 - tpm_count_goshi.csv: CSV格式,基于Zhang et al 2015的RNAseq原始数据计算的基因TPM表达量 - Supplemental_Table_4_GO_df.csv: CSV格式,各BBH类别显著的基因本体(GO)富集结果 - 序列比对结果文件: - Agenes_vs_Ddb_maxtargetseqs1.blastp: BLASTP格式,A亚基因组基因对D亚基因组数据库的比对结果 - Dgenes_vs_Adb_maxtargetseqs1.blastp: BLASTP格式,D亚基因组基因对A亚基因组数据库的比对结果 - 分析代码文件: - Homoeolog_BBH_vs_OMA_all_analyses_1Apr2021.ipynb: Jupyter Notebook格式,包含所有分析代码 - Homoeolog_BBH_vs_OMA_all_analyses_1Apr2021.html: HTML格式,分析代码的网页版

适用场景

  • 植物基因组学研究: 分析陆地棉同源基因对的特征及进化关系
  • 同源基因预测方法评估: 比较BBH与OMA方法在同源基因推断中的差异
  • 基因功能注释: 基于GO富集结果研究不同BBH类别的基因功能
  • 转录组数据分析: 结合TPM表达量探究同源基因的表达模式
  • 生物信息学方法复现: 通过Notebook文件复现论文中的分析流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 68.51 MiB
最后更新 2025年12月25日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。