-
GenePT_Gene_Embeddings_Based_基因与细胞基础模型完整嵌入数据
2025年12月11日 30 2 1
数据集概述 该数据集包含人类基因的NCBI及UniProt(如适用)摘要文本,以及基于这些摘要通过OpenAI的text-embedding-ada-002和text-embedding-3-large模型生成的基因嵌入数据,为基因与细胞基础模型GenePT提供支持。 文件详解 文件名称: NCBI_summary_of_genes.json...
-
BenchStab蛋白稳定性突变预测比较数据集
2025年12月9日 30 180 146
数据集概述 本数据集为BenchStab工具配套数据,用于独立评估18种基于结构和4种基于序列的蛋白稳定性突变预测工具。数据来自FireProtDB的单点突变实验ΔΔG值,经UniRef50和SCOP聚类去重后得到289条记录,包含36种蛋白,其中约百分之二十八为稳定突变。 文件详解 文件名称: dataset.csv 文件格式: CSV 字段映射:...
-
深海微生物群落结构与代谢季节性变化原位采样数据集
2025年12月8日 30 189 70
数据集概述 该数据集用于研究深海活性微生物群落结构与代谢的季节性变化,包含两个版本。版本一提供宏基因组组装基因组(MAGs)的氨基酸序列及KEGG数据库注释;版本二含定制代谢标记基因数据库压缩包及对应注释表,为深海微生物功能研究提供数据支持。 文件详解 版本一文件(未提供具体文件名): .faa格式文件:存储各MAG的氨基酸序列...
-
Combat_TB_NeoDB结核研究整合分析数据库
2025年12月8日 30 11 4
数据集概述 该数据集是基于图数据库技术构建的结核研究整合知识库,整合了结核分枝杆菌组学数据及相关生物资源数据,支持复杂联合查询,为结核研究提供开放数据支持。 文件详解 文件名称: uniprot_data.zip,文件格式: ZIP,包含UniProt相关数据的压缩文件 文件名称: neodb-db-data.tar.bz2,文件格式:...
-
肝脂肪变性与脂肪性肝炎性别差异转录组功能元分析数据集
2025年12月8日 30 140 103
数据集概述 本数据集为《肝脂肪变性与脂肪性肝炎:转录组研究中性别差异的功能元分析》论文的结果与补充材料,包含7项转录组研究的表达矩阵、差异基因/通路分析结果、功能富集分析及元分析显著结果等,支持性别差异相关机制研究。 文件详解 该数据集包含8个压缩文件,具体说明如下: - 01_MatExp.zip:压缩文件,包含7项选定研究的基因表达矩阵 -...
-
人类肠道噬菌体编码抗CRISPR蛋白发现数据集
2025年11月29日 30 47 35
数据集概述 本数据集包含支持人类肠道微生物组中CRISPR-Cas系统与抗CRISPR(Acr)蛋白系统性识别和表征的补充表格。涵盖CRISPR-Cas系统检测、分类、系统发育分析,噬菌体编码Acr预测,Acr候选选择、功能验证及结构分析等核心内容。 文件详解 目录: Discovery of human gut phage-encoded Anti-...
-
婴儿利什曼原虫_JPCM5_蛋白编码序列数据集
2025年11月28日 30 127 1
数据集概述 该数据集包含婴儿利什曼原虫(JPCM5株)已注释的8532个蛋白编码基因的编码序列,基因注释结合了转录组学、蛋白质组学研究及文献来源信息,数据以Fasta格式存储。 文件详解 文件名称:LINF_Genes-CDS_24ago24.fasta 文件格式:Fasta (.fasta)...
-
儿童急性淋巴细胞白血病药物重定位的蛋白质与配体数据集
2025年11月28日 30 56 2
数据集概述 本数据集包含蛋白质序列和配体数据两部分,用于儿童急性淋巴细胞白血病(ALL)的药物重定位计算研究。蛋白质序列来自UniProt数据库,配体数据来自ChEMBL、DrugBank及手动补充的FDA批准药物,支持生物信息学、药物发现等领域研究。 文件详解 数据集目录: Protein and Ligand Dataset for Drug...
-
Metanetx_UniProt_酶选择工具基础数据包
2025年11月27日 30 203 65
数据集概述 本数据集为运行酶选择工具所需的基础数据文件,基于Metanetx和UniProt数据库构建。数据以压缩包形式提供,包含支持酶催化反应选择的相关信息。在未来的版本更新中,计划采用RetroRules作为新的数据生成来源。数据集仅包含一个压缩文件。 文件详解 数据压缩包 文件名称:data.tar.gz 文件格式:GZ(压缩归档文件)...
-
蛋白质摘要测试集-UniProt数据库摘要批量检索数据集-adarshr
2025年6月1日 30 151 102
蛋白质摘要测试集-UniProt数据库摘要批量检索数据集-adarshr 数据来源:互联网公开数据 标签:蛋白质,摘要,生物信息学,UniProt,文本挖掘,生物医学,测试集 数据概述:...
-
UniProt蛋白质注释数据集-198446条样本-visualcomments
2025年6月1日 30 90 9
UniProt蛋白质注释数据集-198446条样本-visualcomments 数据来源:互联网公开数据 标签:UniProt,蛋白质,注释,生物信息学,基因组学,API数据,学术研究 数据概述: 本数据集包含了使用UniProt...
-
蛋白质亚细胞定位与生物信息数据集-CAFA5训练集-lnalinaf
2025年4月22日 30 148 36
蛋白质亚细胞定位与生物信息数据集-CAFA5训练集-lnalinaf 数据来源:互联网公开数据 标签:蛋白质,亚细胞定位,生物信息学,UniProt,CAFA5,蛋白质组学,细胞生物学,机器学习,生物数据 数据概述: 本数据集包含CAFA5(Critical Assessment of Function Annotation...
-
蛋白质数据库UniProt蛋白质信息查询数据集
2025年4月14日 30 67 50
蛋白质数据库UniProt蛋白质信息查询数据集 数据来源:互联网公开数据 标签:蛋白质,UniProt,基因,蛋白质长度,生物信息学,帕金森,Kaggle竞赛,蛋白质组学 数据概述:...



