-
X_approach_Based本体填充方法评估数据集
2026年1月31日 30 181 52
数据集概述 本数据集包含11个文件,用于评估X-approach本体填充方法。数据分为输入、黄金标准和输出三类:输入含法语房产领域知识图谱及78条房产广告语料库;黄金标准为语料库填充后的标准知识图谱;输出含基于两种词形还原工具(Aker、TreeTagger)和四种方法(X-approach等)生成的8个知识图谱文件,可用于本体填充方法的性能对比分析。...
-
KOnPoTe_Resources_船只与餐厅语义资源数据
2026年1月30日 30 197 159
数据集概述 本数据集包含KOnPoTe项目下与船只和餐厅相关的语义资源数据,涵盖本体结果、黄金标准、本体输入文件及语料库文件,共8个文件,主要用于自然语言处理领域的语义分析与本体构建相关研究。 文件详解 OWL文件(6个)...
-
EconBiz_Based_经济学学术图表文本提取图像数据集
2026年1月29日 30 184 53
数据集概述 本数据集是经济学领域的学术图表文本提取语料库,包含121张学术图表,随机抽取自EconBiz的288,000篇开放获取出版物。图表类型涵盖条形图、饼图、折线图、地图、散点图等,所有图表均经过人工标注形成黄金标准,用于评估文本提取工具。 文件详解 文件名称:EconBiz.zip 文件格式:ZIP...
-
LingPy_Based_语音对齐优化次级序列结构处理补充数据
2026年1月29日 30 53 45
数据集概述 本数据集是论文“Improving phonetic alignment by handling secondary sequence structures”的补充材料,包含5个PSA格式文件,用于对比传统语音对齐算法与支持次级序列结构的优化算法的性能差异,提供了基准标准、算法输出及差异分析结果。 文件详解 黄金标准文件...
-
孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集
2026年1月28日 30 207 61
数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
-
金标准二维状态图_Dipy标准状态纤维束图及状态表面IO测试数据
2026年1月28日 30 41 35
数据集概述 本数据集是Dipy中StatefulTractogram(SFT)和StatefulSurface(SFS)的IO测试黄金标准,包含31个文件,涉及数据流(trk、tck等)和网格(gii、ply等)多种格式,用于验证不同文件格式的输入输出功能,覆盖11种文件类型,以.txt格式为主。 文件详解 数据流相关文件...
-
金标准平行圣经_德语_英语新约文本_附带斯特朗编号注释及评估数据
2026年1月27日 30 167 155
数据集概述 本数据集为平行圣经文本提供黄金标准,包含20段新约经文的Strong编号标注数据,涉及三种德文文本(Luther 2017、Schlachter、Hoffnung für alle)和两种英文文本(New Revised Standard Version、World English Bible),用于评估圣经文本的Strong编号标注工作。...
-
CrowdTruth_Based_众包命名实体黄金标准数据_v1_0
2026年1月23日 30 104 35
数据集概述 本数据集包含通过混合多命名实体识别(Multi-NER)众包增强方法,在英文维基百科句子中识别和分类命名实体的实验结果,提供众包标注的命名实体黄金标准数据,支持自然语言处理领域的相关研究与应用。 文件详解 文件名称:CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard-v1.0.zip...
-
KOnPoTe_Based_法语房产领域文本知识图谱构建实验评估数据
2026年1月23日 30 197 57
数据集概述 本数据集包含用于评估KOnPoTe(从文本中填充知识图谱/本体)方法的11个文件,覆盖法语房产销售领域。内容分为输入数据、黄金标准和输出结果三类,支持分析不同词形还原工具与方法对知识图谱构建的影响。 文件详解 输入文件(Inputs) 文件名称:biens_immobiliers.owl 文件格式:OWL...
-
ISO_25010_Based软件质量特征在线用户评论标注黄金标准数据
2026年1月23日 30 119 34
数据集概述 本数据集是ISO/IEC 25010:2011软件产品质量分类体系的黄金标准标注数据,对360条应用商店用户评论(拆分后共1358个句子)按8个质量特征及31个子特征进行标注。数据覆盖6类应用(娱乐、生产力等)、3个应用商店,每条评论对应1-5星评分,由4名标注者使用ISO 25010标准完成标注。 文件详解...
-
Yearbook_Gold_Standard_临床NLP文献综述筛查流程标准数据集_2017
2026年1月12日 30 110 0
数据集概述 本数据集是临床自然语言处理(Clinical NLP)领域文献综述筛查流程的黄金标准数据集,用于支持相关研究中的文献筛选工作。数据集包含1个压缩文件,无分层目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 文件名称:Yearbook_2017.zip 文件格式:ZIP(压缩包)...
-
CIRCSE_Latin_Sentiment_Lexicons_Based拉丁语情感词典第二版发布数据
2026年1月2日 30 170 88
数据集概述 本数据集为CIRCSE/Latin_Sentiment_Lexicons的第二版发布资源,包含拉丁语形容词和名词的情感词典,新增融合黄金标准与白银标准的“Latin Affectus”数据集,且该数据集已关联至LiLa知识库,适用于拉丁语情感分析相关研究。 文件详解...
-
古希腊语与葡萄牙语翻译对齐标准与黄金标准数据集
2025年12月18日 30 148 19
数据集概述 本数据集包含古希腊语文本与葡萄牙语翻译对齐的指导标准及黄金标准数据,基于古希腊语-英语对齐指南改编,由领域专家使用Ugarit工具完成对齐,可支持相关文本对齐任务、数据集构建或自动化模型训练。 文件详解 文件名称:grc.txt 文件格式:.txt 内容说明:原始古希腊语文本文件 文件名称:por.txt 文件格式:.txt...
-
MEDDOCAN西班牙语临床病例报告匿名化标注数据集
2025年12月16日 30 206 187
数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
-
论文_使用知识图谱嵌入和层次聚类的分类法提取_补充材料
2025年12月15日 30 119 71
数据集概述 该数据集为论文"使用知识图谱嵌入和层次聚类的分类法提取"的补充材料,包含非表达性分类法提取任务的输入数据、黄金标准,以及非表达性和表达性案例的提取分类法示例,可辅助理解论文研究方法与结果。 文件详解 readme.txt: 文本格式,说明文件内容,包括非表达性与表达性分类法提取的数据构成,如黄金标准文件、输入数据及提取结果文件的对应关系。...
-
古希腊语到英语翻译对齐标注指南与黄金标准数据集
2025年12月15日 30 34 9
数据集概述 该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。 文件详解 文件名称: eng.txt 文件格式: TXT (.txt) 内容说明:...
-
二氧化碳排放标注的黄金标准与标注数据集
2025年12月15日 30 100 93
数据集概述 本数据集是用于从企业年度及可持续发展报告中提取温室气体排放数据的基准数据集,包含黄金标准数据集与标注数据集,涵盖三个阶段的标注结果,为相关研究提供标准化数据支持。 文件详解 数据文件:...
-
古希腊与拉丁语翻译对齐标注指南及黄金标准数据集
2025年12月14日 30 23 2
数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...
-
SoMeSci_科学文献中的软件提及数据集
2025年12月13日 30 178 68
数据集概述 该数据集是通过人工标注构建的科学文献中软件提及的黄金标准知识图谱,包含原始黄金标准数据及所有软件相关引用的标注内容,为科学文献中软件提及的研究提供标准化数据支持。 文件详解 Formal_Citation.zip:压缩文件,包含所有软件相关引用的标注数据 SoMeSci.zip:压缩文件,包含原始SoMeSci黄金标准数据 数据来源...
-
Zenodo_ESWC23_Based_身份图优化算法论文配套完整数据
2025年12月11日 30 146 122
数据集概述 该数据集是ESWC'23会议论文《Refining Large Integrated Identity Graphs using the Unique Name Assumption》的配套资源,包含论文代码、数据及执行历史等相关文件,为复现论文研究提供支持。 文件详解 文件名称: Shuai_iUNA_ESWC_camera_ready...



