数据集概述
本数据集存储了人类基因组中G-四链体(G4s)与顺式调控元件(CREs)关系分析的相关数据及脚本。包含通过G4Hunter软件预测的全基因组潜在G4位点数据、候选顺式调控元件中G4存在情况的注释文件,以及基于R语言的数据分析源代码,支持基因组调控元件相关研究。
文件详解
- G4Hunter_w25_s1.5_hg38.txt
- 文件格式:TXT
- 字段映射介绍:包含人类基因组(hg38版本)中潜在G4结构的预测结果,字段依次为染色体(chr)、起始位置、终止位置、长度、链方向、得分等,对应G4Hunter软件参数(窗口大小25、得分阈值1.5)
- G4_cCRE_annotation.txt
- 文件格式:TXT
- 字段映射介绍:标注候选顺式调控元件(cCREs,来源于SCREEN数据库)中是否存在G4结构的注释信息
- scripts.zip
- 文件格式:ZIP
- 内容介绍:包含本项目使用的R语言数据分析源代码
数据来源
论文“G-quadruplexes as pivotal components of cis-regulatory elements in the human genome”
适用场景
- 基因组调控元件研究:分析G4结构在人类顺式调控元件中的分布特征及功能作用
- G4结构预测验证:基于G4Hunter软件结果,验证不同参数下基因组G4位点的预测准确性
- 生物信息学方法开发:参考R语言脚本,优化基因组元件关联分析的算法流程
- 基因组注释数据应用:结合cCRE注释文件,探索G4结构对基因表达调控的影响机制