-
Tolosa_Treebank_Occitan语言依存句法标注数据
2026年1月27日 30 109 11
数据集概述 本数据集是首个奥克语依存树库,由POCTEFA Interreg欧洲基金资助的EFA 227/16 LINGUATEC项目开发。包含25K个标注了词性标签、词元及句法依存关系的词元,遵循通用依存关系(UD)标注规范,数据以ConLL-U格式存储,覆盖加斯科涅、朗格多克、勒穆瓦纳和普罗旺斯四种主要奥克语方言。 文件详解...
-
俄语虚词_KA的意义语法与词源研究数据集
2025年12月8日 30 143 100
数据集概述 本数据集基于莫斯科方言学圈特邀报告扩展修订,聚焦俄语虚词-KA(-KO)的意义、语法、词源及环波罗的海区域联系,结合现代标准俄语、北部俄语方言及俄语-维普斯语/卡累利阿语平行语料展开分析。 文件详解 文件名称: Particle KA 05 June.pdf 文件格式: PDF(.pdf) 文件内容: 包含研究报告全文,涉及虚词-...



