-
Chadic_Based_语方向词比较形态句法项目数据
2026年1月31日 0 73 71
数据集概述 本数据集是Chadic语方向词比较形态句法项目的修订重投版本,包含22个Jupyter Notebook代码文件、11个CSV数据文件和1个XLSX文件,共34个文件。内容覆盖语言方向词的形态句法分析、计算脚本及可视化相关数据,支持Chadic语方向词的比较研究与分析。 文件详解 代码文件(.ipynb)...
-
VeLeCa_Source_加泰罗尼亚语动词词形变化词库数据
2026年1月29日 30 98 35
数据集概述 本数据集为VeLeCa,即加泰罗尼亚语动词屈折变化词库,包含三千四百八十四个词位的十七万四千二百个词形的语音形式,以及对应的词汇、形态句法属性和频率数据。数据集总计十个文件,覆盖数据、文档、代码等类型,为加泰罗尼亚语动词的语言学研究提供结构化资源。 文件详解 数据文件(CSV格式,共5个)...
-
Parahungarian_Based_匈牙利名词范式词典数据集
2026年1月28日 30 57 40
数据集概述 本数据集为匈牙利名词数据集,基于Unimorph数据清理而来,采用Paralex标准格式构建,包含10个文件,涵盖结构化CSV表格、说明文档、元数据等。数据以关系模型组织,提供匈牙利名词的词形、词素、特征值等信息,适用于语言学研究与自然语言处理任务。 文件详解 数据文件(CSV格式,共5个)...
-
ArchiMob_Based_瑞士德语变体口语转录语料库_Release_1
2026年1月20日 30 94 31
数据集概述 本数据集为ArchiMob语料库Release 1,包含瑞士境内使用的德语变体口语转录文本,是首个瑞士德语长文本电子资源,总规模达528381个词元,可用于形态句法特征空间分布研究及自然语言处理任务。 文件详解 文件名称:ArchiMob_Release1_160812.zip 文件格式:ZIP(压缩包)...
-
Codice_diplomatico_toscano_托斯卡纳775_813年原始宪章TEI_XML数据
2026年1月1日 30 196 108
数据集概述 本数据集为《Codice diplomatico toscano 2:1》的TEI XML版本,收录公元775至813年间托斯卡纳地区的原始宪章及同期副本。数据保留了与形态句法分析相关的缩写扩展、脱漏标注等外交信息,添加ChLA编号以便与摹本对比,且经Timo Korkiakangas修正。数据集含一个XML文件,无目录结构。 文件详解...
-
俄语与乌兹别克语形容词名词模态形式对比研究
2025年12月22日 30 163 148
数据集概述 该数据集为一篇学术论文,聚焦俄语与乌兹别克语中形容词名词的模态形式,基于语法及词汇语义特征展开分析,探讨两种语言在模态意义形成机制、词缀使用、语法范畴等方面的差异,揭示形容词在语言系统中的功能特性。 文件详解 文件名称: Базарова Нодира Шамсиевна.pdf 文件格式: PDF 内容说明:...
-
斯拉夫形态句法地理与接触配置关联数据集
2025年12月20日 30 70 11
数据集概述 本数据集为论文《斯拉夫形态句法主要由其地理位置和接触配置决定》的原始数据,包含与斯拉夫语言形态句法特征相关的指标数据,涉及语言属性、地理区域、人称标记等维度,支持相关语言特征与地理及接触因素关联的研究。 文件详解...
-
俄语语法中的内屈折现象研究论文2018
2025年12月19日 30 38 2
数据集概述 本数据集包含一篇2018年发表的学术论文,聚焦俄语语法中的内屈折现象,分析否定代词、不定代词及特定句法习语中的内屈折插入规则,探讨其在形态句法层面的特征与应用价值。 文件详解 文件名称:zimmerling_24_Do-They-Des.pdf 文件格式:PDF 文件内容:该论文系统讨论俄语内屈折现象,包括否定代词、不定代词(含кое-...
-
语言学神话_俄语与冰岛语分析数据集2019
2025年12月19日 30 65 9
数据集概述 本数据集是2019年5月在莫斯科举办的北极文化互动国际会议上的演讲文稿,聚焦俄语与冰岛语研究中存在的“语言学神话”,分析俄冰语言研究领域共享的错误认知及其成因,涉及理论误导、直觉偏差等因素。 文件详解 文件名称: 59418776.pdf 文件格式: PDF (.pdf) 文件内容:...
-
词中附着词类型学研究会议讲稿2016
2025年12月18日 30 140 72
数据集概述 本数据集为2016年莫斯科举办的“形态句法参数类型学”会议讲稿草稿,聚焦词中附着词的参数理论发展,基于10种语言/方言案例提出核心观点:词中附着词存在,但非由附着词固有特征触发,而是特定形态附着词基在句法位置再分析的结果。 文件详解 文件名称:Endoclitics 2026.pdf 文件格式:PDF(.pdf)...
-
伏尔加地区芬兰_乌戈尔语类型学数据库2024
2025年12月15日 30 67 6
数据集概述 该数据集是伏尔加地区芬兰-乌戈尔语类型学数据库,聚焦马里语、乌德穆尔特语和科米-彼尔米亚克语的形态学、形态句法现象及语序模式,含两百余项参数,与乌戈尔语数据库参数一致,支持未来合并。 文件详解 文件名称:volgatyp-2024-04-30.html 文件格式:HTML(.html) 内容说明:包含伏尔加地区芬兰-...
-
形态句法祖先状态重建的贝叶斯方法补充文件
2025年12月12日 30 29 28
数据集概述 本数据集是期刊投稿的补充文件,围绕形态句法祖先状态重建的贝叶斯方法展开,包含用于说明、编码、树结构及来源参考的多类型文件,为相关研究提供辅助数据支持。 文件详解 tree.pdf: PDF格式,共识树文件,用于研究结果的可视化说明 data.txt: TXT格式,编码文件,包含语言编码数据(预览示例:AghuTharrnggala...
-
英语名物化对标注数据库
2025年12月8日 30 20 7
数据集概述 该数据集是基于英国网络语料库(ukWaC)提取的3440条索引行,对英语中40个名物化词元(20个-ing形式、20个-(t)ion形式)的标注数据库。名物化按相同词根配对,用于研究英语事件性名物化的动词属性表现。 文件详解 文件名称: Annotated database of nominalization pairs in...
-
ELTE_Poetry_Corpus_Based_匈牙利经典诗歌多维度特征标注完整数据
2025年12月6日 30 20 5
数据集概述 该数据集为ELTE诗歌语料库,包含匈牙利53位经典诗人的14358首完整诗歌,涵盖词汇语法特征、押韵模式、节奏、头韵等诗歌声音特征,以TEI及非TEI XML格式存储,为诗歌研究提供结构化标注数据。 文件详解 文件名称:poetry-corpus-1.0.zip 文件格式:ZIP压缩包 内部目录及内容: level1:人工校验的TEI...



