-
Leveraging_Natural_Language_图形程序合成数据集_2020
2026年1月18日 30 79 45
数据集概述 本数据集为程序合成数据集,包含图形程序任务及语言注释(含合成注释与人工注释),用于支持自然语言在程序搜索与抽象学习中的应用研究。该数据集关联论文目前处于NeurIPS 2020审稿阶段,审稿后将进行匿名解除处理。 文件详解 文件名称:logo.zip 文件格式:ZIP...
-
进化表型黄金标准语料库与实体质量本体注释数据集
2025年12月22日 30 142 5
数据集概述 本数据集包含进化表型描述的黄金标准语料库(源自系统发育研究的特征状态描述)及专家标注的实体质量(EQ)本体注释,可支持机器推理以量化表型描述的语义相似度,同时包含相关本体文件及用于评估机器标注工具性能的人工与机器生成注释。 文件详解 文档类文件: README.md:Markdown格式,说明数据集核心内容、结构及使用背景 Author-...
-
CodiEsp西班牙语临床病例ICD10编码金标准数据集_CLEF2020
2025年12月19日 30 57 45
数据集概述 该数据集是CLEF eHealth 2020 CodiEsp赛道的西班牙语临床病例金标准语料库,包含训练集、开发集、测试集(含人工注释)及未标注背景集,共一千个临床病例,采用CIE10(西班牙版ICD10)编码术语,为非英语临床病例自动编码研究提供标注数据。 文件详解 数据集为zip压缩包,包含四个文件夹,具体如下: -...



