-
Tigrinya_Analogy_Test_词嵌入模型评估数据集
2026年2月13日 30 144 51
数据集概述 本数据集是提格利尼亚语版的谷歌类比测试集,用于评估词嵌入模型质量。数据经机器翻译后由母语者人工验证,剔除了不适用的条目,最终包含一万八千四百六十五条语义和句法类比条目,分为首都、货币、家庭、时态等九个测试小节。 文件详解 文件名称:TigrinyaAnalogyTest.zip 文件格式:ZIP...
-
埃塞俄比亚母语分布1976年地图数据集
2025年12月13日 30 198 99
数据集概述 该数据集包含1976年出版的埃塞俄比亚母语分布地图,重点展示提格利尼亚语的地理分布范围,包括其与苏丹边境、东非大裂谷悬崖的位置关系,以及跨默勒布河、特克泽河的分布情况,同时标注库纳马语的分布区域。 文件详解 文件名称: Distribution of Mother Tongues 1976 v2.pdf 文件格式: PDF 内容说明:...
-
提格利尼亚语语言建模数据集TLMD_v1_0_0
2025年12月13日 30 56 38
数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...



