找到26个数据集

标签: 语法研究

过滤结果
  • IN01006_Based_梵语Rawan宪章XML文献数据

    2026年2月9日 30 116 68

    数据集概述 本数据集包含IN01006编号的Narendra的Rawan宪章梵语文献,以XML格式存储,无附加元数据。数据集仅含一个文件,用于提供结构化的梵语历史文献内容,支持梵语文献研究与文本分析。 文件详解 文件名称:IN01006.xml 文件格式:XML...
    packageimg
  • dictionaria_kalamang_语言词典数据

    2026年1月31日 30 149 66

    数据集概述 本数据集为Kalamang语言词典,由Visser, Eline于2020年发布,属于Dictionaria系列第13卷,内容涵盖1-2737页。数据以压缩包形式提供,是研究Kalamang语言的重要资源。 文件详解 文件名称:dictionaria/kalamang-v1.2.zip 文件格式:ZIP...
    packageimg
  • IN01059_Sanskrit_XML_梵语历史授权文书数据

    2026年1月28日 30 121 32

    数据集概述 本数据集包含IN01059号文献《Mrgesavarman 4年Devagiri授权文书》的梵语XML文件,无元数据。文件总数1个,无目录层级,未划分训练/测试、数据/标签或原始/处理集,主要文件类型为XML,占比百分之百。 文件详解 文件名称:IN01059.xml 文件格式:XML 字段映射介绍:包含《Mrgesavarman...
    packageimg
  • Variations_Based_斯洛伐克语附着词位置变异研究数据集

    2026年1月23日 30 162 71

    数据集概述 本数据集为论文“Variations on positioning of clitics in Slovak (on the basis of corpus and experimental data)”配套数据,核心内容围绕斯洛伐克语中附着词的位置变异展开,基于语料库和实验数据构建,包含一个文件,用于支撑相关语言学研究分析。 文件详解...
    packageimg
  • IN02027_Siddham_梵语铭文Epidoc格式XML数据草稿

    2026年1月23日 30 174 23

    数据集概述 本数据集为IN02027 Tsapaligaon铭文的梵语XML文件,属于Epidoc格式草稿版本,不含元数据,计划纳入"Siddham"档案。数据集仅包含一个XML文件,用于铭文文献的数字化存储与分析。 文件详解 文件名称:IN02027.xml 文件格式:XML 字段映射介绍:为IN02027...
    packageimg
  • Paralatvian_Paralex_Based_拉脱维亚语名词屈折数据集

    2026年1月20日 30 72 34

    数据集概述 本数据集是遵循Paralex标准格式的拉脱维亚语名词屈折数据集,由Unimorph数据清理而来,包含9个文件,无目录层级。数据采用关系模型结构化存储,以CSV表格为主,辅以元数据和说明文档,覆盖名词的词形、屈折特征、音素等信息,适用于拉脱维亚语语法研究与自然语言处理任务。 文件详解 数据文件(.csv):共5个...
    packageimg
  • P_demotion_Extended_Sample_语言学实验扩展样本数据集

    2026年1月20日 30 27 6

    数据集概述 本数据集是Polonez Bis项目(编号2021/43/P/HS2/01395)的组成部分,由Adam Mickiewicz University的Katarzyna Janic团队创建并填充,数据收集自语法挖掘及语言专家咨询。数据集对应Polonez Bis 1项目的扩展样本,包含1个Excel文件,当前处于待调整状态。 文件详解...
    packageimg
  • IN02028_Based_Siddham档案待整合_梵语碑文铭文XML草案数据

    2026年1月19日 30 101 42

    数据集概述 本数据集为IN02028 Cyasaltole Patan碑刻铭文的梵语XML文件,是Epidoc格式的草案版本,不含元数据,计划纳入"Siddham"档案。数据记录了该碑刻铭文的数字化文本内容,为古文字学、梵语研究提供基础资料。 文件详解 文件名称:IN02028.xml 文件格式:XML...
    packageimg
  • dictionaria_sanzhi_Sanzhi_Dargwa词典数据_2019

    2026年1月18日 30 97 18

    数据集概述 本数据集为Sanzhi Dargwa语言的词典数据,由Diana Forker于2019年发布,收录于Dictionaria第5卷。数据以压缩包形式提供,包含Sanzhi Dargwa语言的词典内容,可用于语言研究、词典编纂等相关场景。 文件详解 文件名称:dictionaria/sanzhi-v1.2.zip 文件格式:ZIP...
    packageimg
  • Tiefo_D_Lexicon_Based语言词汇表_Daramandugu地区_2021年4月

    2026年1月8日 30 116 27

    数据集概述 本数据集为Daramandugu地区Tiefo-D语言的词汇表,需与同作者的《Tiefo-D语法》(DOI:10.5281/zenodo.4715103)及《Tiefo-D文本集》(DOI:10.5281/zenodo.4715132)配合使用,使用说明见语法附录及文本集附录。后续将在密歇根大学图书馆Deep...
    packageimg
  • IN02004_Sanskrit_Base_of_Pillar_Inscription梵语铭文XML草稿数据

    2025年12月29日 30 63 4

    数据集概述 本数据集包含IN02004号Changu Narayana柱基铭文的梵语XML文件,为Epidoc格式草稿版,无元数据,计划纳入"Siddham"档案。数据记录该柱基铭文的梵语文本内容,是研究古代铭文文献的基础资料。 文件详解 文件名称:IN02004.xml 文件格式:XML...
    packageimg
  • 受限特征动词在乌兹别克语中的完美体方面应用及表达数据集

    2025年12月22日 30 102 3

    数据集概述 本数据集围绕乌兹别克语中受限特征动词的完美体方面应用及表达展开,包含相关研究内容的文档资料,为理解乌兹别克语动词的语法特征与表达提供支持。 文件详解 文件名称: Aziza Odilovna Muminova.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • Dictionaria_Hdi_Dictionary_Based_2017年Hdi语言词典完整数据

    2025年12月22日 30 203 33

    数据集概述 该数据集为Hdi语言的词典数据,由Frajzyngier等学者于2017年发布,收录于Dictionaria 2,共1681页,提供Hdi语言词汇的系统记录,支持语言研究与文献参考。 文件详解 文件名称: dictionaria/hdi-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 中古保加利亚语句法否定与附着词研究数据集

    2025年12月21日 30 147 15

    数据集概述 该数据集围绕中古保加利亚语的附着词语法及一般否定词位置展开研究,重点分析约公元1386-1509年的瓦拉几亚保加利亚语书信文本,探讨否定标记与附着词排序的相互依赖关系及语法演变初期特征。 文件详解 文件名称:Zimmerling Dimitrova_Sententional Negation 2019.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 英语与乌兹别克语地点状语从句复合句同构与异构特征研究

    2025年12月19日 30 202 70

    数据集概述 本数据集聚焦英语与乌兹别克语中含地点状语从句的复合句,探讨其同构与异构特征,包含一篇相关研究文档,为语言对比研究提供资料支持。 文件详解 文件名称: Turgunova E.E.pdf 文件格式: PDF (.pdf) 文件内容: 研究英语与乌兹别克语中带地点状语从句的复合句的同构和异构特征的文档 适用场景 对比语言学研究:...
    packageimg
  • 阿拉伯语动词变位规则要求文件

    2025年12月18日 30 24 14

    数据集概述 该数据集包含一份关于阿拉伯语动词变位规则要求的文档,以PDF格式呈现,为学习或研究阿拉伯语动词变位提供参考资料。 文件详解 文件名称: Мансур Жуманиёзов.pdf 文件格式: PDF (.pdf) 文件内容: 文档内容围绕阿拉伯语动词变位的规则要求展开,具体字段或详细内容需查看PDF文件内部获取 适用场景 阿拉伯语语言学习:...
    packageimg
  • 萨米语借词来源不定代词及代词中出现元素数据集

    2025年12月12日 30 107 90

    数据集概述 该数据集包含一篇PDF文档,围绕萨米语中借词来源的不定代词及代词中出现的元素展开研究,是学术论文的附属资料,为萨米语语法及词汇演变研究提供支持。 文件详解 文件名称: JuutinenMettovaara_saamenindefiniitit_taul_20210311.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 哥廷根印度语言电子文本注册_弥曼差部数据集

    2025年12月12日 30 121 120

    数据集概述 该数据集是哥廷根印度语言电子文本注册(GRETIL)中关于弥曼差部(Mīmāṃsā)的电子文本集合,包含三十七个HTML格式文件,无目录层级,所有文件直接存储于根目录。 文件详解 文件类型与数量:共三十七个文件,均为HTML格式(.htm),占比百分之百...
    packageimg
  • 赫梯语言词库数字版测试版0_2数据集

    2025年12月12日 30 150 48

    数据集概述 该数据集为赫梯语言词库数字版(TLHdig)测试版0.2的XML文档集合,是美因茨赫梯学门户网站的工具之一,包含标准化、可搜索、带注释的赫梯楔形文字手稿转写文本,反映百年来赫梯学研究成果。 文件详解 文件名称:TLHdig_0.2.0-beta.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含TLHdig Beta...
    packageimg
  • 不同时期语言学中乌兹别克语语法范畴分类数据集

    2025年12月11日 30 23 2

    数据集概述 本数据集聚焦不同时期语言学研究中乌兹别克语语法范畴的分类问题,包含一份核心研究文档,为理解乌兹别克语语法体系的历史演变与分类逻辑提供资料支持。 文件详解 文件名称:Madrahimov Ilhomjon Sobirovich.pdf 文件格式:PDF...
    packageimg