DroSeq_人类初级微小核糖核酸成熟功能图谱数据集

数据集概述

该数据集通过深度测序实验DroSeq,记录了微处理器(DROSHA/DGCR8)在体外切割人类初级微小核糖核酸(pri-miRNA)的效率数据,包含GC含量、香农熵等计算特征,为研究miRNA成熟机制提供支持。

文件详解

该数据集包含4个文件,分布在1个目录中,具体说明如下: - 主数据文件: - harmonized_pri-miRNA.feather: Feather格式文件,包含完整的处理后数据,可通过Apache Arrow读取为pandas或R数据框,包含GC含量、香农熵等特征字段 - harmonized_pri-miRNA.csv: CSV格式文件,字段包括miRNA名称、序列、长度、GC含量、香农熵、切割效率相关指标等,数据列少于feather文件 - 中间计数文件(位于 Intermediate count files/ 目录下): - miRbase.csv: CSV格式文件,字段包括miRNA名称、有无Drosha处理的计数、重复实验信息、异常值标记等 - all_variomics.csv: CSV格式文件,推测为与变异组学相关的中间计数数据

适用场景

  • 分子生物学研究: 分析微处理器对不同pri-miRNA的切割效率差异
  • 生物信息学分析: 探究序列特征(如GC含量、二级结构)与miRNA成熟效率的关联
  • 非编码RNA功能研究: 辅助解析miRNA生物发生过程中的关键调控机制
  • 计算生物学建模: 基于序列和结构特征构建miRNA成熟效率预测模型
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 27.16 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。