-
TEI_XML_Based_萨克森选帝侯约翰_格奥尔格二世1665年宫廷日记完整转录数据_Release2
2025年12月30日 30 89 5
数据集概述 本数据集包含1665年萨克森选帝侯约翰·格奥尔格二世宫廷日记(SLUB Mscr.Dresd.K.80)的完整手写转录版本,遵循DTABF标准提供TEI:XML格式文件及PDF阅读版。XML文件通过元素拆分日记条目,标注日期、人物、地点及格式元素,PDF由TEIGarage简单转换生成,未优化排版。 文件详解 文件名称:SLUB Dresd...
-
UIMA_ConceptMapper_Based_2021_BioASQ语料库药物与癫痫本体术语标注字典数据
2025年12月28日 30 199 41
数据集概述 本数据集包含用于UIMA ConceptMapper工具的字典文件,用于对2021 BioASQ语料库进行药物名称及癫痫本体术语标注。字典分别源自DrugBank词汇库及NCBO BioPortal的EpSO、ESSO、EPILONT、EPISEM、FENICS五种癫痫本体,共六个XML格式文件,可支撑生物医学文本的语义实体识别与标注。...
-
俄语词义消歧语料库_RuSemCor
2025年12月23日 30 128 38
数据集概述 该数据集是一个为俄语设计的词义消歧语料库,通过WordNet进行语义标注,属于链接开放数据云(LLOD cloud)资源。包含标注数据文件和语料库归档文件,支持自然语言处理领域的词义消歧研究。 文件详解 文件名称: sense_annotations.tsv 文件格式: TSV (.tsv) 字段映射:...
-
ARASAAC黑白象形图数据集第五部分
2025年12月23日 30 67 32
数据集概述 该数据集为ARASAAC项目的黑白象形图资源,包含一千张PNG格式的黑白图像,主题涵盖信息、医学、自然、技术等多个领域,由Sergio Palao创作,是ARASAAC十四部分象形图资源中的第五部分。 文件详解...
-
动词的语义与语用解释数据集
2025年12月22日 30 27 9
数据集概述 该数据集包含一份关于动词语义与语用解释的文档,聚焦于动词在语言使用中的意义理解与实际应用分析,为语言学领域相关研究提供资料支持。 文件详解 文件名称: N.Djumaeva .pdf 文件格式: PDF (.pdf) 文件内容: 文档类文件,围绕动词的语义与语用解释展开论述,具体内容需通过阅读PDF获取。 适用场景 语言学研究:...
-
BiodivTab语义表格标注任务基准数据集
2025年12月22日 30 161 135
数据集概述 本数据集是针对语义表格标注任务的基准数据集BiodivTab,以表格形式组织生物多样性相关数据,为评估语义表格标注算法性能提供标准测试资源。 文件详解 文件名称: BiodivTab_DBpedia.zip:压缩文件格式,内容未提供预览,推测包含与DBpedia关联的生物多样性表格数据。 文件名称:...
-
乌尔都语中源自英语的医学术语结构语义分析
2025年12月21日 30 71 4
数据集概述 该数据集包含一份关于乌尔都语中源自英语的医学术语的结构语义分析文档,以PDF格式呈现,为研究医学术语跨语言演变及语义特征提供资料支持。 文件详解 文件名称: Vahobova Shoira.pdf 文件格式: PDF (.pdf) 文件内容: 围绕乌尔都语中源自英语的医学术语展开结构与语义层面的分析,具体内容需查阅文档原文。 适用场景...
-
GOOSE三维语义分割挑战赛标签数据集
2025年12月20日 30 162 23
数据集概述 该数据集包含GOOSE和GOOSE-Ex数据集的LiDAR点云语义分割标注。原始64类标注被整合为8个超类加“其他”类,共含一万三千零六份标注点云,以.label格式存储,遵循SemanticKITTI数据集格式规范。 文件详解 文件名称: README.txt,文件格式: TXT (.txt),内容:...
-
GitTables基准测试_列类型检测数据集
2025年12月20日 30 106 48
数据集概述 本数据集是GitTables语料库的一个子集,专为列类型检测方法的基准测试设计。它基于DBpedia和Schema.org本体的语义类型,用于评估系统对表格列进行语义标注的能力,曾用于SemTab 2021挑战赛的CTA任务。数据集包含表格样本、目标列信息、标注真值及标签映射文件,支持列类型检测模型的训练与评估。 文件详解...
-
含道德伦理评价意义的俄语成语数据集
2025年12月7日 30 111 91
数据集概述 该数据集核心内容为包含道德伦理评价意义的俄语成语,以单个PDF文档形式呈现,为研究俄语成语的语义特征及道德伦理内涵提供数据支持。 文件详解 文件名称: Расулов Илхом Инамович.pdf 文件格式: PDF (.pdf) 文件内容: 包含具有道德伦理评价意义的俄语成语相关内容,具体字段及结构需通过PDF文档内容解析获取...
-
Mataws标注Web服务集合数据集
2025年12月16日 30 8 0
数据集概述 该数据集包含八百一十六个Web服务描述,基于Assam项目FullDataset扩展而来,通过Mataws工具添加语义标注。每个服务含语法版与语义版两种格式(WSDL和OWL-S),并按主题分类,为Web服务语义标注研究提供数据支持。 文件详解 文件名称: Annotated.FD-v1.0.zip 文件格式: ZIP压缩包 内容说明:...
-
古典雅典法律主体本体数据集v_1_0
2025年12月14日 30 109 44
数据集概述 该数据集为古典雅典法律主体本体的1.0版本,聚焦公元前约四百一十九年至三百二十三年雅典法庭的主要法律主体定义,法律主体指主持或裁决法律程序的个人或群体,基于阿提卡演说词、伪亚里士多德《雅典政制》及相关著作构建。 文件详解 文件名称: Legal_bodies_Ontology_v.1.0.rdf,文件格式:...
-
ARASAAC彩色象形图第四部分_共16部分
2025年12月14日 30 128 77
数据集概述 该数据集包含由Sergio Palao为ARASAAC创建的黑白象形图,属于16部分系列中的第四部分,共计一千个PNG格式文件,无目录层级结构,未提供数据分割信息。 文件详解 文件构成:共计一千个文件,均为PNG格式,占比百分之百...
-
意大利语动词情感推理词典
2025年12月14日 30 155 92
数据集概述 本数据集是用于情感推理的意大利语动词词典,包含动词的句法框架、极性、语义效果、关系及示例等信息,部分动词通过同义词框架引用关联,为意大利语文本的情感分析提供结构化动词语义标注支持。 文件详解 文件名称: clicl.pdf 文件格式: PDF 内容说明: 提供数据集理论背景与构建方法的相关论文,解释动词规范的理论基础。 文件名称:...
-
范妮_门德尔松致威廉_亨塞尔书信转录数据集
2025年12月14日 30 79 17
数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
-
ARASAAC黑白象形图数据集第一部分_共十四部分
2025年12月14日 30 171 92
数据集概述 本数据集包含由Sergio Palao为ARASAAC创建的黑白象形图,共一千张PNG格式图片,无目录层级结构。图片覆盖信息公告、职业、日期、节日等主题,为图像识别、辅助沟通等场景提供视觉素材。 文件详解 核心文件组:...
-
SemEval_2020_无监督词汇语义变化检测瑞典语测试数据集
2025年12月12日 30 70 48
数据集概述 本数据集为SemEval 2020任务1(无监督词汇语义变化检测)的瑞典语测试数据,包含两个不同时期的瑞典语文本语料库、31个目标词元及对应语义变化标注结果,用于评估词汇语义变化检测模型性能。 文件详解 该数据集包含一个ZIP格式压缩包,内部文件结构及内容如下: -...
-
多语言历史报纸命名实体识别实体链接与立场检测数据集2021
2025年12月11日 30 194 66
数据集概述 该数据集为多语言历史报纸资源,包含1850-1950年法语、德语、芬兰语和瑞典语的历史报纸材料,涵盖命名实体识别、实体链接及实体立场检测标注,用于开发和评估历史文档的命名实体处理系统。 文件详解 文件名称: NewsEye-GT-NER_EL_StD-v1.zip 文件格式: ZIP压缩包 内容说明:...
-
俄语多词表达式分布语义模型数据集
2025年12月9日 30 160 32
数据集概述 本数据集包含俄语多词表达式,依据名词短语与其中心词意义间是否存在“范畴转换”筛选。含173个存在转换的正向样本和173个无转换的负向样本,标注用于进一步分类,为分布语义模型(DSM)词汇构建提供数据支持。 文件详解 文档文件(PDF格式,共3个): Dataset_part1.pdf:第一部分数据集文档...
-
西班牙手语书写VisSE语料库
2025年12月7日 30 141 49
数据集概述 该数据集是西班牙手语书写(SignWriting)的语料库,包含经图形与语义标注的手写样本,覆盖西班牙手语的词汇与视觉含义。还提供用于自动识别的训练神经网络,支持Quevedo及第三方工具,采用标准开放格式。 文件详解...



