-
意大利语动词情感推理词典
2025年12月14日 30 59 22
数据集概述 本数据集是用于情感推理的意大利语动词词典,包含动词的句法框架、极性、语义效果、关系及示例等信息,部分动词通过同义词框架引用关联,为意大利语文本的情感分析提供结构化动词语义标注支持。 文件详解 文件名称: clicl.pdf 文件格式: PDF 内容说明: 提供数据集理论背景与构建方法的相关论文,解释动词规范的理论基础。 文件名称:...
-
瑞典语计算词使用图数据集2_0_0
2025年12月13日 30 181 145
数据集概述 该数据集包含针对瑞典语的计算词使用图(Word Usage Graphs, WUGs),通过计算语义邻近模型自动标注使用对(边权重),可支持瑞典语词汇语义分析相关研究。 文件详解 文件名称:swewug_2.0.0.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含瑞典语计算词使用图数据,具体数据格式及处理代码可参考WUGsite获取...
-
西班牙语循证医学临床试验语料库3版
2025年12月12日 30 94 18
数据集概述 该数据集是西班牙语的循证医学临床试验语料库(3版),包含一千二百篇文本(二十九万二千一百七十三条词元),涵盖期刊摘要与临床试验公告,标注了医学实体、语义关系等信息,为医学文本分析提供支持。 文件详解 文件名称:CT-EBM-SP-v3.zip 文件格式:ZIP压缩包...
-
赫尔辛基大学_Semantic_Domains_Based_阿卡德语词汇网络2_0完整数据
2025年12月9日 30 132 73
数据集概述 本数据集为赫尔辛基大学阿卡德语文本语义域项目创建的ANEE词汇网络2.0版本,包含GEXF格式的网络文件,以压缩包形式存储,提供词汇网络相关数据支持。 文件详解 文件名称: Data_scripts.zip 文件格式: ZIP压缩包 内容说明: 可能包含与数据集相关的数据处理脚本文件 文件名称: Networks.zip 文件格式:...
-
哥廷根印度语言电子文本注册处词典学数据集
2025年12月6日 30 175 129
数据集概述 该数据集是哥廷根印度语言电子文本注册处(GRETIL)下的词典学相关数据,主要包含四个HTML格式的文件,未区分训练/测试集、数据/标签集或原始/处理数据,文件类型单一。 文件详解 数据集包含4个HTML格式文件,具体如下: 文件名称:amark2_u.htm、amark3_u.htm、amark1pu.htm、amark1hu.htm...
-
佛教梵语嵌入模型评估数据集
2025年12月4日 30 183 144
数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...
-
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72
2025年5月30日 30 195 157
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72 数据来源:互联网公开数据 标签:词向量, 自然语言处理, 文本分析, 共现矩阵, 词嵌入, 语义关系, 机器学习, 数据挖掘 数据概述: 该数据集包含用于词向量分析的文本数据,记录了词语之间的共现关系。主要特征如下:...
-
WordNet超义词数据集-2006-duketemon
2025年4月24日 30 33 32
WordNet超义词数据集-2006-duketemon 数据来源:互联网公开数据 标签:WordNet,超义词,语义关系,自然语言处理,NLP,语言学,数据集 数据概述:...
-
上下文词义推理数据集
2025年4月15日 30 41 29
上下文词义推理数据集 数据来源:互联网公开数据 标签:词义推理,自然语言处理,语义关系,同义词,超义词,上下文分析,问答系统 数据概述: 本数据集提供了基于上下文的细粒度词义推理注释。数据集包含3,750个词对,每个词对都在一个上下文句子中出现,这些词对来自PPDB的一个子集。每个词对都被标注了在给定上下文中它们之间存在的语义关系。 数据用途概述:...



