-
LanguageStructure_Xavante_dicionario_葡萄牙语词典合并数据
2026年1月11日 30 173 162
数据集概述 本数据集为Xavante语与葡萄牙语的双语词典数据,包含词典内容的合并处理结果,涉及内容修正与音频添加等优化工作,以单一JSON文件形式呈现,可用于语言翻译、词典研究等场景。 文件详解 文件名称:xavante_dictionary_merged.json 文件格式:JSON...
-
乌兹别克语停用词列表数据集
2025年12月23日 30 77 62
数据集概述 本数据集包含通过三种自动方法从乌兹别克语"学校语料库"生成的停用词列表,涵盖单字词、双字词及带搭配的双字词停用词,为乌兹别克语自然语言处理任务提供基础资源。 文件详解 压缩包文件: uzbek_stopwords.zip: ZIP格式压缩包,包含以下核心文件: stopwords_unigrams.txt:...



