ProGen2_Generated_生物基因序列生成与适应性评估数据

数据集概述

本数据集包含预训练和微调ProGen2模型生成的基因序列,以及用于评估该模型的适应性基准数据。数据以压缩包形式存储,共2个文件,无目录结构,主要用于生物信息学领域的基因序列相关研究与模型评估。

文件详解

  • generated_sequences.zip
  • 文件格式:ZIP
  • 内容说明:包含ProGen2模型(预训练及微调版本)生成的基因序列数据
  • fitness_data.zip
  • 文件格式:ZIP
  • 内容说明:包含用于评估ProGen2模型性能的适应性基准数据

适用场景

  • 生物信息学模型评估: 用于测试和验证ProGen2模型在基因序列生成任务中的性能表现
  • 基因序列研究: 分析预训练与微调模型生成的基因序列特征及差异
  • 适应性基准构建: 基于提供的适应性数据,建立或优化基因序列模型的评估标准
  • 生物基因领域算法开发: 为生物信息学领域的基因序列生成算法研究提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 298.65 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。