-
ACA_多语言核心论元标注数据库
2026年2月12日 30 40 30
数据集概述 本数据集包含英语、老挝语和俄语三种语言的及物从句语料库示例,标注了作为句法主语和宾语(A和P)的核心论元。数据集采用与Alena Witzlack-Makarevich共同开发的编码方案,包含数据库描述文档和三种语言的标注文本文件,总计四个文件,为跨语言句法结构研究提供结构化标注资源。 文件详解 数据库描述文档...
-
Eesthetic_爱沙尼亚语词形范式数据v1_0_5
2026年1月31日 30 75 11
数据集概述 本数据集为Eesthetic,是爱沙尼亚语动词和名词的词形范式集合,包含音位和正字法两种记法,适用于计算与人工分析,符合Paralex标准。数据集仅含一个压缩文件。 文件详解 文件名称:eesthetic-v1.0.5.zip 文件格式:ZIP...
-
Linguistic_Criteria_Based_11种语言词类区分与重叠的语言标准数据
2026年1月13日 30 128 18
数据集概述 本数据集包含11种语言中名词、动词、形容词和副词的词类区分及重叠案例的语言标准信息,涵盖音系、形态、句法、语义等标准类型,用于支撑《词类描述类型学》硕士论文研究,共3个文件。 文件详解 Linguistic_Criteria_Final_excel.xlsx 文件格式:XLSX...
-
葡萄牙语文本中的性别偏见数据集
2025年12月22日 30 40 38
数据集概述 该数据集包含用于研究葡萄牙语文本中性别偏见的相关数据,包括精选的葡萄牙语文学语料库、构建句子模板的词表以及已生成的句子模板文件,为基于掩码语言模型的性别偏见分析提供支持。 文件详解 语料库文件: corpus.zip:压缩文件,包含1804-1998年巴西和欧洲葡萄牙语的592部散文作品,共120万句、1760万词的精选文学语料库...
-
动词的语义与语用解释数据集
2025年12月22日 30 110 41
数据集概述 该数据集包含一份关于动词语义与语用解释的文档,聚焦于动词在语言使用中的意义理解与实际应用分析,为语言学领域相关研究提供资料支持。 文件详解 文件名称: N.Djumaeva .pdf 文件格式: PDF (.pdf) 文件内容: 文档类文件,围绕动词的语义与语用解释展开论述,具体内容需通过阅读PDF获取。 适用场景 语言学研究:...
-
语言主观性研究文献
2025年12月8日 30 165 2
数据集概述 本数据集包含一篇关于语言主观性的研究文献,围绕语言表达中说话者主观性的呈现展开,探讨语言主观性的不同定义、指示词作用、主观性词类及显隐性表现等核心内容。 文件详解 文件名称: Mirela IVAN - 6-15.pdf 文件格式: PDF 内容概述:...
-
佛教梵语嵌入模型评估数据集
2025年12月4日 30 6 3
数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...



