-
swadesh_Source_库尔曼吉语斯瓦迪士核心词表数据
2026年2月8日 30 129 17
数据集概述 本数据集为库尔曼吉语(Kurmanji)的斯瓦迪士核心词表数据,包含一个压缩文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集,主要用于语言学领域的词汇研究与分析。 文件详解 压缩文件 文件名称:swadesh-V1.1.zip 文件格式:ZIP...
-
Lexibank_Based_嘉绒语族语言历史比较词汇数据集2023
2026年2月6日 0 87 1
数据集概述 本数据集是基于Lai和List 2023年《嘉绒语族语言比较》的CLDF格式词汇数据,包含嘉绒语族语言的历史比较词汇信息,由莱比锡马克斯·普朗克进化人类学研究所发布,版本为1.0,仅含一个压缩文件。 文件详解 文件名称:lexibank/lairgyalrong-v0.4.zip 文件格式:ZIP...
-
La_Pola_Siero_感知问卷问题1数据
2026年2月1日 30 86 31
数据集概述 本数据集属于La Pola Siero方言语料库的一部分,包含感知问卷的第一个问题内容。数据集仅含一个文件,无目录层级划分,未进行训练测试、数据标签或原始/处理数据的拆分,主要用于语言学领域对该方言的感知研究。 文件详解 文件名称:Pregunta 1 del cuestionario perceptivo.docx 文件格式:DOCX...
-
dsfsi_Based非洲语言新闻语料库2022
2026年2月1日 30 68 5
数据集概述 本数据集为2022年的isiZulu新闻(含文章及标题)与Siswati新闻(仅标题)语料库,包含相关非洲语言的新闻文本资源,支持非洲语言的自然语言处理研究,数据集以单个压缩文件形式呈现。 文件详解 文件名称:dsfsi/za-isizulu-siswati-news-2022-v0.9.5.zip 文件格式:ZIP...
-
人类语言资源库_基于博罗罗语的词汇数据库存档文件
2026年2月1日 30 199 40
数据集概述 本数据集为Bororoan词汇数据库,包含一个压缩文件,属于tupian-language-resources目录下的语言资源,未提供具体描述,文件类型单一为压缩包。 文件详解 文件名称:bororo-v0.9.5.zip 文件格式:ZIP 字段映射介绍:压缩包文件,包含Bororoan词汇数据库相关内容,具体内部结构及字段信息未提供预览。...
-
VeLeSpa_Spanish_西班牙语动词词库数据
2026年1月31日 30 118 86
数据集概述 本数据集为VeLeSpa,是半岛西班牙语的动词词库,包含六百五十五三个动词的全部六十三个音系形式词形变化范式,以及对应的词目级和词形级频率数据。数据集共包含十个文件,涵盖数据表格、说明文档、代码文件等类型。 文件详解 数据文件(CSV格式) 文件名称:VeLeSpa_cells.csv、VeLeSpa_features-...
-
Kpelle_Mano_语半自发话语标注论文补充数据
2026年1月31日 30 43 26
数据集概述 本数据集为待评审论文的补充材料,包含Kpelle语和Mano语的半自发话语标注内容,提供一份结构化的语言数据文件,支持相关语言学研究与分析。 文件详解 文件名称:all_data_submission.xlsx 文件格式:XLSX...
-
CFL_Based汉字构形特征与手写汉字易读性研究数据
2026年1月31日 30 104 22
数据集概述 本数据集围绕汉字构形特征与CFL(中文作为外语)初学者手写汉字易读性的关系展开,包含一份研究数据文件,可用于分析汉字结构特征对初学者手写汉字辨识度的影响。 文件详解 文件名称:Research Data.xlsx 文件格式:XLSX...
-
English_Yoruba_英语到约鲁巴语翻译数据集
2026年1月31日 30 181 67
数据集概述 本数据集为英语到约鲁巴语的翻译数据,适用于Android手机的短消息服务语音和文本翻译场景,包含1个文件,无目录结构,主要文件格式为.xlsx。 文件详解 文件名称:Updated Translation Datasets.xlsx 文件格式:XLSX...
-
LIM_SOAS_Based藏语动词配价可视化词典数据
2026年1月31日 30 86 21
数据集概述 本数据集包含支撑《藏语动词配价可视化词典》的JSON格式数据及其说明文档,由英国研究与创新署(UKRI)资助、伦敦大学亚非学院(SOAS)开展的“动态词典学:藏语动词史”(LIM)项目产出,总计包含两个文件。 文件详解 数据文件 文件名称:LIM_TibetanVerbValencyDictionary_data.json...
-
Kam_kdx_Lesage非洲语言词汇表数据2019
2026年1月31日 30 116 3
数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
-
TLS_Based_中国语言学词库_2024_07_23
2026年1月30日 30 133 91
数据集概述 本数据集为中国语言学词库(Thesaurus Linguae Sericae, TLS)的互联Markdown文件压缩包,包含一份2024年7月23日的词库数据压缩文件,无额外目录结构,主要用于语言学研究与词库应用场景。 文件详解 文件名称:tls-md-2024-07-23.zip 文件格式:ZIP...
-
CLDF_Ivani_Suansu基础词汇数据集2019
2026年1月30日 30 146 40
数据集概述 本数据集是基于Ivani 2019年关于印度东北部藏缅语族语言Suansu的基础词汇研究形成的CLDF格式数据集,核心内容为Suansu语言的基础词汇信息,为语言研究提供结构化资源。 文件详解 文件名称:lexibank/ivanisuansu-v2.0.zip 文件格式:ZIP...
-
Pere_Based科特迪瓦濒危语言动植物词汇表完整数据
2026年1月30日 30 71 24
数据集概述 本数据集为科特迪瓦Pere(又称Bere、Mbre)语言的动植物词汇表。Pere是科特迪瓦中部的严重濒危语言,在Glottolog中以代码mbre1244、ISO 639-3中以代码mka收录。数据集包含一份Excel文件,记录该语言中动植物相关术语,为濒危语言保护和词汇研究提供基础资源。 文件详解 文件名称:Pɛrɛ flora...
-
Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据
2026年1月30日 30 59 2
数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
-
AI4D_Based法语至丰贝埃维神经机器翻译平行文本数据集
2026年1月29日 30 181 125
数据集概述 本数据集是面向神经机器翻译任务的多语言平行文本集合,包含从法语到丰贝语(多哥语言)、法语到埃维语(贝宁语言)的平行句子对,总计七万余条标注数据,适用于机器翻译和句子分类任务,由AI4D倡议贡献。 文件详解 文件名称:French_to_fongbe.csv 文件格式:CSV...
-
CLDF_NorthPeruLex_秘鲁北部小语种词汇数据集
2026年1月29日 30 206 20
数据集概述 本数据集为基于CLDF格式的词汇数据集,源自Ugarte等人即将发布的"NorthPeruLex"项目,收录秘鲁北部小语种家族及孤立语言的词汇信息,为该区域语言研究提供结构化数据支持。 文件详解 主文件包 文件名称:lexibank/northperulex-v0.2.zip 文件格式:ZIP...
-
Caucalex_Based_高加索52语言词汇数据集1_0
2026年1月29日 30 24 1
数据集概述 本数据集为Caucalex 1.0,包含高加索地区52种语言的词汇数据,覆盖卡尔特维利语系、纳赫-达吉斯坦语系、西北高加索语系、印欧语系和突厥语系五大语言家族,是研究高加索语言词汇特征的基础资料。 文件详解 文件名称:Caucalex 1.0.xlsx 文件格式:XLSX...
-
ParaKasem_Paralex兼容_Kasem名词数据集
2026年1月29日 30 186 13
数据集概述 本数据集为符合Paralex标准的Kasem名词数据集,基于Niggli and Niggli (2007)的研究并经Guzmán Naranjo (2019)人工修正,以关系型CSV表格结构呈现,包含发音、词素、形态等结构化信息,共10个文件,支持语言学范式词典研究。 文件详解 文档类文件...
-
Parabank_Based_黎巴嫩亲属称谓范式标注完整数据
2026年1月29日 30 151 30
数据集概述 本数据集为Parabank项目中按亲属称谓范式标注的黎巴嫩亲属称谓数据,记录了符合该范式的黎巴嫩亲属称谓信息,可用于语言学领域中亲属称谓系统的研究,仅包含一个文件。 文件详解 文件名称:Parabank_Lebanese.xlsx 文件格式:XLSX...



