数据集概述
本数据集围绕红火蚁(Solenopsis invicta)社会超基因的进化展开,包含超基因倒位区域的克隆、基因内容分析及表达调控机制研究相关数据。涉及多个大型倒位事件(>9 Mb和>800 Kb)的鉴定、时间顺序分析,以及倒位对邻近基因启动子的影响研究,为理解超基因的形成机制与选择优势提供支撑,共含14个文件。
文件详解
- 序列文件(.fa/.fasta格式)
- 文件名称:pseudo_Slittleb.fa、SW_Ba_BACs.fa、fragment_C_scaffold01957.fa、Sgem_tw_t3p_000043F.fa、pseudo_SBigB.fa、Sinv_littleb_tw_t2p.fa、slice_sc000058F_lbt2p_25kinsert.fasta
- 文件格式:FASTA
- 字段映射介绍:存储不同超基因片段(如pseudo_Slittleb、pseudo_SBigB)、BAC克隆(SW_Ba_BACs)及特定基因区域(fragment_C_scaffold01957)的核苷酸序列,用于序列比对与结构分析
- 比对结果文件(.txt格式)
- 文件名称:pseudo_Slittleb_mega_pseudo_SBigB_outfmt6.txt、SW_Ba_BACs_mega_gng.txt、Si_gnF.scaffold01957_G12_mega_littleb_t2.txt、fragment_C_scaffold01957_mega_sgem_t3p.txt
- 文件格式:TXT
- 字段映射介绍:记录序列比对结果(如outfmt6格式的BLAST输出)及基因区域的结构分析数据,包含序列相似性、位置分布等信息
- 说明文档(.xlsx格式)
- 文件名称:README_for_pseudo_Slittleb.xlsx、README_for_SW_Ba_BACs_mega_gng.xlsx、README_for_pseudo_SBigB.xlsx
- 文件格式:XLSX
- 字段映射介绍:各核心序列数据(pseudo_Slittleb、pseudo_SBigB、SW_Ba_BACs)的说明文档,包含数据来源、处理方法及字段解释等信息
数据来源
论文“Multiple large inversions and breakpoint rewiring of gene expression in the evolution of the fire ant social supergene”
适用场景
- 超基因进化机制研究:分析火蚁社会超基因的多重大倒位事件、形成时间顺序及选择优势
- 基因表达调控分析:探究倒位断点对邻近基因启动子的重排效应,及其对社会性状的调控机制
- 昆虫社会行为遗传学研究:解析超基因与蚁群 queen 数量等社会性状的关联机制
- 基因组结构变异分析:利用序列比对数据研究大型倒位对基因组结构与功能的影响