-
格鲁吉亚语语言资源数据集2018
数据集概述 本数据集包含2018年夏季学期在柏林洪堡大学语言学硕士课程中收集的格鲁吉亚语语言资源,包括ASJP词汇表录音、不及物动词形态形式录音及相关元数据文档,为格鲁吉亚语语言学研究提供原始语音与文本数据支持。 文件详解 词汇表录音文件组(20180528_ASJPSwadesh_HK_EP):...
-
跨语言共现数据库LOGOS数据集1_0
数据集概述 该数据集为跨语言共现数据库(CLICS)的LOGOS数据版本1.0,由List等人于2014年发布,记录跨语言词汇共现现象,为语言比较研究提供基础数据支持。 文件详解 文件名称: lexibank/logos-v4.0.zip:压缩文件格式,包含跨语言共现数据库的LOGOS数据,具体字段需解压后查看,未提供预览内容。 数据来源 List,...
-
藏语古典词性标注词汇表
数据集概述 该数据集是为自然语言处理(NLP)任务构建的藏语古典词性标注词汇表。数据来源于动词词干数字化版本及人工标注的训练数据,部分词汇通过手动添加以优化基于规则的词性标注,适用于藏语古典文本的词性分析与处理。 文件详解 文件名称: Lexicons.zip 文件格式: ZIP压缩包 内容说明:...



