数据集概述
本数据集为论文《A reference-free algorithm discovers regulation in the plant transcriptome》的补充材料,包含高粱、玉米、拟南芥等植物数据集的显著锚点及关联基因列表,用于生成论文图表的锚点-靶标组合计数数据,以及隐蔽剪接锚点示例数据,支持植物转录组调控机制研究。
文件详解
- 补充表格文件(ZIP格式):
- SuppTableA_sorghum_summary_anchors_genes_only.tsv.zip:高粱数据集显著锚点及关联基因列表
- SuppTableB_maize_summary_anchors_genes_only.tsv.zip:玉米数据集显著锚点及关联基因列表
- SuppTableC_arabidopsis_pfe_summary_anchors_genes_only.tsv.zip:拟南芥P/Fe数据集显著锚点及关联基因列表
- SuppTableD_arabidopsis_floe1_summary_anchors_genes_only.tsv.zip:拟南芥FLOE1数据集显著锚点及关联基因列表
- 图表生成数据文件(TXT格式):
- arabidopsis_floe1_ALL_anchors_satc_truncated.txt:拟南芥FLOE1数据集锚点-靶标组合计数,字段包括样本ID、锚点、靶标、计数
- arabidopsis_pfe_ALL_anchors_satc_truncated.txt:拟南芥P/Fe数据集锚点-靶标组合计数,字段同上
- maize_pollen_ALL_anchors_satc_truncated.txt:玉米数据集锚点-靶标组合计数,字段同上
- sorghum_drought_ALL_anchors_satc_truncated.txt:高粱数据集锚点-靶标组合计数,字段同上
- 隐蔽剪接锚点数据文件(TSV格式):
- cryptic_splicing_anchors.tsv:隐蔽剪接锚点示例列表,字段包括数据集名称、基因名/ID、锚点序列、靶标1序列、靶标2序列
适用场景
- 植物分子生物学研究:分析不同植物数据集的转录组调控锚点及关联基因
- 转录组学分析:探究锚点-靶标组合在植物非生物胁迫(如干旱)中的调控作用
- 基因表达调控研究:验证无参考算法在发现植物转录组隐蔽剪接等新型调控机制中的应用
- 生物信息学算法验证:为开发或优化植物转录组调控分析算法提供基准数据