-
RegEl_Based_生物医学文献调控元件基因疾病关联数据库_2022
2026年1月22日 30 160 114
数据集概述 本数据集是基于RegEl语料库训练的HunFlair模型对超过2000万篇PubMed摘要进行文本挖掘生成的数据库,包含调控元件(增强子、启动子、TFBS)及其与基因(标准化为NCBI Gene ID)和疾病(标准化为MeSH或OMIM)的关联注释,以压缩包形式提供。 文件详解 文件名称:regel_db.zip 文件格式:ZIP...
-
Source_data_CNN_Model_Training_GM12878细胞沉默子增强子预测数据
2026年1月3日 30 50 21
数据集概述 本数据集为训练CNN模型提供源数据,用于预测GM12878细胞中的沉默子、增强子并识别超级沉默子。包含训练、验证、测试三类实验数据文件,以bed格式为主,辅以说明文档和表格文件,总计十一个文件,可支持基因调控元件预测模型的构建与验证。 文件详解 训练数据文件...
-
哺乳动物皮质细胞类型特异性增强子预测方法评估数据集
2025年12月7日 30 62 48
数据集概述 该数据集围绕哺乳动物皮质中细胞类型特异性增强子的预测方法评估展开,包含相关的数据资源,为研究增强子预测技术提供支持。 文件详解 文件名称:data.png 文件格式:PNG (.png) 内容说明:该文件为图片格式,具体内容未提供预览信息 数据来源 Allen Institute 适用场景...
-
基因组基准数据集版本1
2025年12月4日 30 51 36
数据集概述 该数据集为《Genomic benchmarks: a collection of datasets for genomic sequence classification》手稿中发表的数据集集合,包含27个文件,涉及人类、果蝇等物种的基因组序列分类相关数据,支持基因组序列分类研究。 文件详解 该数据集包含两种格式的文件,具体说明如下: -...



