-
CanPests_Based_加拿大节肢动物害虫综合数据集V1
2026年1月28日 30 80 5
数据集概述 本数据集是加拿大节肢动物害虫(本土及外来物种)的综合数据集,包含物种信息、DNA条形码数据、分布情况、参考文献等内容,还提供数据提取与整理的代码文件,可用于节肢动物研究、生物多样性分析等场景,共6个文件。 文件详解 数据文件(.tsv格式,共4个)...
-
Sulawesi_Based标志性偶蹄类动物同步分化研究数据集
2026年1月28日 0 110 1
数据集概述 本数据集围绕苏拉威西标志性偶蹄类动物(鹿豚、倭水牛、苏拉威西疣猪)的同步分化展开,整合了基因数据与形态测量数据,用于验证近期地质事件对物种分化的驱动作用,为理解该区域特有生物多样性形成机制提供支撑。 文件详解 基因序列文件(.fasta)...
-
Kumimanu_Petradyptes_古企鹅化石进化研究数据
2026年1月28日 30 27 15
数据集概述 本数据集包含新西兰晚古新世莫拉基组9个新古企鹅标本的研究数据,涉及新物种Kumimanu fordycei(可能为已知最大企鹅)、Petradyptes stonehousei及未命名小体型物种的形态特征、系统发育分析及体型估算结果,支持企鹅早期进化中体型达上限的研究结论。 文件详解 文档类文件 文件名称:Supplement-...
-
iBOL_Based_植物DNA条形码数据2_00_6_00版本
2026年1月28日 30 58 10
数据集概述 本数据集为国际生命条形码项目(iBOL)发布的植物DNA条形码数据,包含2.00至6.00版本的17个压缩文件,涵盖不同阶段的植物DNA条形码信息,可用于植物物种鉴定与分类研究。 文件详解 压缩文件包...
-
SUBINTERNM_Ontologies_网络匹配优化实验数据
2026年1月28日 30 144 142
数据集概述 本数据集为论文《SUBINTERNM: Optimizing Internetwork Matching of Ontologies》的实验数据,包含实验结果、脚本、输出文件、参考对齐及本体文件等199个文件,覆盖OWL、TXT、RDF等9种格式,用于支持本体网络匹配优化方法的验证与分析。 文件详解 实验结果文件...
-
BRI_Screening_巴西可重复性计划生物医学文章筛选数据
2026年1月28日 30 77 55
数据集概述 本数据集包含巴西可重复性计划中筛选的生物医学文章相关实验数据,基于1998-2017年Web of Science收录的巴西作者发表文章,通过全文检索目标方法并人工验证,提取文章使用的方法、PCR细节、组织、实验模型等信息,用于支持生物医学研究可重复性分析。 文件详解 主数据文件(两种格式) 文件名称:article-data-BRI-...
-
NLUCat_Based_加泰罗尼亚语NLU意图与槽位标注数据集
2026年1月28日 30 57 28
数据集概述 本数据集为加泰罗尼亚语的自然语言理解(NLU)数据集,包含近1.2万条标注指令,涵盖虚拟家庭助手常用意图及弱势群体的社会、医疗需求意图,标注细粒度槽位并考虑加泰罗尼亚语使用者的地理文化背景。可用于训练意图分类、槽位识别及示例生成模型。 文件详解 主数据集文件 文件名称:NLUCat_dataset.json 文件格式:JSON...
-
T1D_Based_1型糖尿病风险基因介导β细胞存活研究辅助数据
2026年1月28日 30 143 39
数据集概述 本数据集为1型糖尿病(T1D)风险基因介导β细胞在促炎细胞因子刺激下存活机制研究的辅助数据,整合功能基因组学与人类遗传学方法,包含细胞因子响应性顺式调控元件、染色质互作、CRISPR筛选及SNP-SELEX等实验结果,共20个文件,支撑T1D风险相关基因及调控机制的研究。 文件详解 调控元件与染色质互作类...
-
Mytilus_Based_加州中部入侵与本地贻贝基因渐渗研究数据
2026年1月27日 30 71 33
数据集概述 本数据集围绕加州中部贻贝杂交区展开,通过ddRADseq技术对1337个单核苷酸多态性位点进行基因分型,分析入侵种Mytilus galloprovincialis与本地种Mytilus trossulus的基因渐渗方向、程度及隔离屏障作用。数据集包含9个文件,支持区分早期与晚期杂交世代,揭示杂交区基因交流的空间异质性及动态变化。 文件详解...
-
HDHB_SNPAssay_蜜蜂100K单核苷酸多态性阵列开发数据
2026年1月27日 0 17 11
数据集概述 本数据集围绕新开发的蜜蜂高密度SNP基因分型阵列(含103270个SNP)展开,该阵列用于蜜蜂基因组选择、育种及进化适应研究。SNP通过对欧洲61只雄蜂全基因组重测序检测,筛选基于候选区域、基因及育种目标(产蜜量、温顺性、瓦螨抗性)等标准,包含阵列验证及使用建议相关数据,共4个文件。 文件详解...
-
RoMEMES_Source_罗马尼亚社交媒体表情包多模态标注数据
2026年1月27日 30 74 46
数据集概述 本数据集为罗马尼亚语表情包数据集RoMEMES,采集自公共社交媒体平台,包含表情包的文本、图像及相关标注信息。数据经人工标注罗马尼亚语文本、图像复杂度、情感倾向、政治内容属性,文本部分通过RELATE平台自动标注词性、词元及依存句法,同时包含元数据。 文件详解 metadata.tsv 文件格式:TSV...
-
HornMT_Based_非洲之角多语言机器翻译基准平行语料数据集
2026年1月27日 30 77 3
数据集概述 本数据集是针对非洲之角语言的机器翻译基准平行语料库,包含阿法尔语、阿姆哈拉语、英语、奥罗莫语、索马里语、提格雷尼亚语6种语言的新闻片段平行文本,以及每条文本对应的元数据(如新闻范围、类别、来源等),支持多语言机器翻译研究与系统开发。 文件详解 核心数据文件 目录名称:data/...
-
CRC_Based传统治疗诱导肿瘤免疫编辑及免疫微环境调控研究数据
2026年1月27日 30 55 32
数据集概述 本数据集围绕结直肠癌(CRC)传统治疗对肿瘤免疫编辑及免疫微环境的影响展开,包含转移性CRC患者接受mFOLFOX6联合贝伐珠单抗新辅助治疗前后的多组学数据,涵盖外显子测序、RNA测序及新抗原预测结果,可用于分析治疗对肿瘤免疫特性的调控机制。 文件详解 WES_sequenza_CNVs.tsv 文件格式:TSV...
-
PanRes_Based_抗菌耐药基因整合数据库数据_v1_0_2
2026年1月27日 30 106 53
数据集概述 本数据集为PanRes抗菌耐药基因数据库,整合了ResFinder、CARD等多个已发表的抗菌耐药基因(ARGs)集合,形成统一的基因库。包含基因序列文件及注释表,提供基因的来源数据库、聚类信息等元数据,适用于宏基因组中耐药基因的大规模筛查与分析。 文件详解 README.md 文件格式:MD...
-
Phenoscape_Based_比较生物学同源性逻辑模型研究数据
2026年1月27日 30 133 48
数据集概述 本数据集围绕比较生物学中的同源性概念展开,包含历史同源性与系列同源性的逻辑模型研究相关数据。整合了文献中的同源性断言及Phenoscape知识库中脊椎动物鳍和肢体的分类群表型数据,用于评估REA和AVA两种逻辑模型的推理效果,为同源性推理融入本体工具奠定基础。 文件详解 文件名称:SupplementaryMaterials1.txt...
-
ARM_Based_GoAmazon实验气象数据日均值分析_数据集
2026年1月27日 30 80 5
数据集概述 本数据集基于2014-2015年Manacaparu地区T3气象站的分钟级数据,经预处理计算每日各变量均值得到。包含气象要素和气体浓度两类日均值数据,以及对应的元数据文件,总计4个文件,用于GoAmazon实验的数据分析与可视化。 文件详解 数据文件 文件名称:icos.tsv 文件格式:TSV...
-
oncoEnrichR_Based_癌症基因集解释工具使用案例分析数据
2026年1月26日 30 97 52
数据集概述 本数据集为Zenodo仓库中oncoEnrichR工具的两个使用案例分析结果,包含FGFR1网络(蛋白质邻近筛选)和EGFRi药物耐药驱动因素(CRISPR筛选)的预计算报告、输入数据及Docker复现代码,用于癌症基因集的生物信息学解释分析。 文件详解 reports目录 FGFR1 network(蛋白质邻近筛选)子目录...
-
Phenopackets_Based_多语言基因医学案例集_自动更新版
2026年1月26日 30 49 33
数据集概述 本数据集包含基于Phenopackets生成的多语言基因医学案例集,支持捷克语、中文、荷兰语、英语、德语、意大利语、日语、西班牙语和土耳其语共9种语言,用于LLM研究,会随Phenopacket Store更新自动同步最新HPO翻译和案例数据。 文件详解 压缩文件(ZIP)...
-
ClinSpEn_CT_Based_平行英西生物医学术语数据_2022
2026年1月26日 30 168 96
数据集概述 本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。 文件详解...
-
rSAM_Based自由基S_腺苷甲硫氨酸酶序列空间扩展研究补充数据集
2026年1月26日 30 131 52
数据集概述 本数据集为自由基S-腺苷甲硫氨酸(rSAM)依赖酶序列空间扩展研究的补充数据,聚焦翻译后大环化相关酶的分析。包含5个支持信息数据集,涉及前体SSN簇Logo序列、放线菌环芳烃前体、小肽相邻酶分布等内容,为酶序列空间扩展研究提供结构化参考数据。 文件详解 Supporting Information Dataset 1.zip...



