数据集概述
本数据集是UTexas适体数据库的快照,收录了1990-2022年489篇文献中的1415条适体序列,包含同一文献中多个筛选实验产生的序列(不仅限于高亲和力序列)。每条序列关联文献信息、靶标、核酸组成、GC百分比、长度、结合亲和力等元数据,采用宏基因组学式收录策略,为信息分析提供更广泛的序列资源。
文件详解
- 文件名称:UTexas Aptamer Database dataset_Sept2023.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含适体文献信息(发表年份、DOI、引文、通讯作者)、靶标信息,以及适体特征(核酸组成、原始名称、序列、GC百分比、长度、Kd值、缓冲液、应用场景、原始核酸库、修饰信息、内部编号),新增"父序列编号"字段,修复应用场景格式错误。
- 文件名称:UTexas Aptamer Database dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:基础版本适体数据集,包含文献信息、靶标及适体特征字段,无"父序列编号"字段,应用场景格式未修复。
数据来源
UTexas Aptamer Database(https://sites.utexas.edu/aptamerdatabase/)
适用场景
- 适体序列信息学分析: 利用多来源序列开展序列特征、结构与功能关系的大数据分析。
- 高亲和力适体筛选: 通过内置工具从宏基因组式收录的序列中挖掘潜在高亲和力适体。
- 适体应用场景研究: 分析不同应用(如药物递送、生物传感器)对应的适体特征规律。
- 适体筛选实验优化: 参考原始核酸库、缓冲液等元数据,优化新的适体筛选实验设计。
- 适体文献数据整合: 作为文献提取的标准化数据集,支持适体研究领域的文献计量分析。