-
KPAAMCAM_NTs_MASHI_4BAA_5NCM_Based_贝姆布尔诺Lower_Fungom_Mashi词汇表完整数据
数据集概述 该数据集包含一份关于Mashi语言的225个词汇表文档。Mashi是一种属于Yemne-Kimbi语支的语言变体,主要分布在喀麦隆西北部Menchum区Fungom分区的Lower Fungom地区,为研究该语言的词汇特征提供基础数据。 文件详解 文件名称:...
-
古典藏文标注语料库第一部分_基于BDRC数字化文本的分词版本
数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集的古典藏文分词版本语料库,采用TiMBL的基于记忆的标注器进行词性标注,未经过后处理或人工校正,包含12个压缩文件。 文件详解 该数据集包含12个压缩文件,具体说明如下: -...
-
贝纳方言调查数据集2013
数据集概述 该数据集是基于2013年Mitterhofer的《贝纳方言调查》的CLDF格式数据集,聚焦贝纳方言词汇表分析,为研究贝纳方言提供结构化数据支持。 文件详解 文件名称:lexibank/mitterhoferbena-v3.1.zip 文件格式:ZIP压缩包...
-
乌兹别克语语言描述数据集
数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
-
乌兹别克语中_BOBURNOMA_使用的度量单位词汇和句法特征研究
数据集概述 本数据集聚焦于乌兹别克语典籍《BOBURNOMA》中所使用的度量单位,对其词汇特征和句法特征进行研究。 文件详解 文件名称: Sayyora Shodmonova.pdf 文件格式: PDF (.pdf) 文件内容: 该文档围绕《BOBURNOMA》中度量单位的词汇构成、语法结构等特征展开分析,具体内容需通过文档阅读获取。 适用场景...
-
朴素贝叶斯情感分类器生成数据集2023
数据集概述 本数据集是通过朴素贝叶斯分类器算法运行生成的情感分析相关数据,包含词汇表中的单词及其出现次数、似然比等统计信息,以及对应的可视化图表,为情感分类模型的词汇特征分析提供支持。 文件详解 词汇统计文件(CSV格式):...
-
CLDF格式南钦语语言笔记数据集1988
数据集概述 该数据集为CLDF格式,源自1988年Helga So-Hartmann发表的《南钦语语言笔记》,收录了南钦语相关语言学研究内容,为南钦语语言特征分析提供结构化数据支持。 文件详解 文件名称:lexibank/sohartmannchin-v3.1.zip 文件格式:ZIP压缩包(.zip)...
-
现代汉语方言核心词特征词集CLDF数据集2007
数据集概述 该数据集基于2007年《现代汉语方言核心词·特征词集》构建,采用CLDF格式存储,包含现代汉语方言的核心词汇与特征词数据,为方言词汇研究提供结构化资源。 文件详解 文件名称:lexibank/liusinitic-v1.4.zip 文件格式:ZIP压缩包...
-
中古英语头韵诗_阿里马太的约瑟_诗末词数据集
数据集概述 本数据集为论文《中古英语头韵诗<阿里马太的约瑟>半行诗结尾研究》(即将发表于《Medium Ævum》期刊)的原始数据,聚焦该诗歌中的诗末词分析。 文件详解 文件名称:icornelius/joseph-of-arimathea-v0.0.zip 文件格式:压缩文件(.zip)...
-
提格利尼亚语语言建模数据集TLMD_v1_0_0
数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
-
查德语词表数据集1981
数据集概述 该数据集为基于Kraft 1981年《查德语词表》的CLDF格式数据集,包含查德语相关词汇信息,以压缩文件形式存储,为查德语语言学研究提供基础数据支持。 文件详解 文件名称: lexibank/kraftchadic-v4.1.zip 文件格式: ZIP (.zip) 文件内容: 为压缩归档文件,未提供具体内容预览及字段映射信息 数据来源...
-
Korpuslinguistik_Based_Foodblog_Korpus德语美食博客标注完整数据
数据集概述 该数据集是《Korpuslinguistik(narr Starter)》教材的配套材料,包含一百五十篇德语美食博客文章及相关元数据、标注文件。数据格式多样,为德语美食博客文本的语言学分析提供了结构化与非结构化相结合的资源。 文件详解 该数据集包含五个文件,具体说明如下: - 文本集合文件: - Foodblog-...
-
布纳克语文本数据集_Schapper_2010
数据集概述 该数据集包含用于Schapper 2010年博士论文的布纳克语文本及相关说话人信息,布纳克语是帝汶中部的一种巴布亚语言,为研究该语言提供基础文本资料。 文件详解 文件名称: BunaqTextsSchapper2010.pdf 文件格式: PDF (.pdf) 文件内容: 记录了布纳克语的文本内容及其说话人信息,是Schapper...
-
BOBURNOMA_ISLOMIY_ATAMALAR_Based_伊斯兰度量单位术语翻译分析完整数据
数据集概述 本数据集包含一份PDF文档,内容围绕"BOBURNOMA"中以伊斯兰术语表达的度量单位词汇的英文翻译分析展开,为相关翻译研究提供文本资料。 文件详解 文件名称: Sayyora Shodmonova Baxromovna .pdf 文件格式: PDF (.pdf) 文件内容:...
-
同形异义词与同音异义词关联数据集
数据集概述 本数据集聚焦于同形异义词与同音异义词的关联研究,包含一份PDF格式的相关文档,为语言文字领域中词汇语义与语音关系的分析提供基础资料。 文件详解 文件名称: Jurayeva Zulayxo Shamsiddinovna.pdf 文件格式: PDF(.pdf) 内容说明:...
-
哥廷根印度语言电子文本注册中心_奥义书数据集
数据集概述 该数据集是哥廷根印度语言电子文本注册中心(GRETIL)收录的奥义书(UPANIṢAD)相关电子文本集合,包含三十五个HTML格式文件,无目录层级结构,未划分训练测试、数据标签或原始处理数据。 文件详解 文件类型:均为HTML格式(.htm),共三十五个文件...
-
英美英语词汇量比较分析研究
数据集概述 本数据集围绕英国英语与美国英语的词汇量差异展开比较分析研究,包含一份相关的PDF文档,为探讨两种英语变体在词汇使用上的特征与区别提供资料支持。 文件详解 文件名称:Alijonova Barnoxon Valijon qizi.pdf 文件格式:PDF(.pdf)...
-
基于Allen2007年_白语方言调查_的CLDF数据集
数据集概述 该数据集是基于Allen2007年《白语方言调查》生成的CLDF格式数据集,核心内容围绕白语方言的语言调查数据展开,为白语方言研究提供标准化的语言数据支持。 文件详解 文件名称:lexibank/allenbai-v4.1.zip 文件格式:.zip(压缩包) 内容说明:数据集唯一文件,为压缩包格式,未提供内部文件及字段的详细预览信息...
-
Max_Planck_Institute_Lexibank_Based_语言词汇特征预计算完整数据
数据集概述 该数据集为Lexibank²项目的预计算特征数据,版本2.1,包含大规模词汇数据的预计算特征,以压缩包形式存储,用于支持词汇相关的研究与分析。 文件详解 文件名称:lexibank-analysed-v2.1.zip 文件格式:ZIP压缩包...
-
乌兹别克语演讲语言学特征研究文献
数据集概述 本数据集包含一份关于乌兹别克语演讲语言学特征的文献资料,聚焦于该语言在演讲场景下的语言学特性分析,为相关语言研究提供文献参考。 文件详解 文件名称: Hakimov Azizxon.pdf 文件格式: PDF (.pdf) 文件内容: 文献主题为乌兹别克语演讲的语言学特征研究,具体内容需通过阅读PDF文档获取 适用场景...



