找到48个数据集

标签: 语法分析

过滤结果
  • IN02033_EpiDoc_布达尼尔坎塔石刻铭文梵语XML数据

    2026年1月28日 30 65 40

    数据集概述 本数据集为IN02033布达尼尔坎塔石刻铭文的梵语XML文件,属于EpiDoc格式的草稿版本,将纳入"Siddham"档案。数据未包含元数据,仅提供铭文的文本内容数字化记录,是研究该古铭文的基础文本资料。 文件详解 文件名称:IN02033.xml 文件格式:XML...
    packageimg
  • IN02060_凯瓦尔普尔碑文_梵语_XML_草稿_Epidoc版本

    2026年1月27日 30 149 21

    数据集概述 本数据集包含IN02060 Kevalpur铭文的梵语XML文件,为Epidoc格式的草稿版本,计划纳入"Siddham"档案。数据聚焦于该铭文的数字化文本内容,未包含元数据,仅提供一份核心文件用于铭文研究与文本分析。 文件详解 文件名称:IN02060.xml 文件格式:XML...
    packageimg
  • Linguistics_土耳其乌兹别克语受事性与差异宾语标记分析数据

    2026年1月23日 30 129 90

    数据集概述 本数据集为发表于《Linguistics》期刊的论文《土耳其及乌兹别克语中的受事性与差异宾语标记》所使用的分析数据,包含支撑研究的CSV数据与R脚本文件,整体打包为一个压缩文件,供研究者复现或扩展相关语言学分析。 文件详解 文件名称:Kizilkaya_et_al.zip 文件格式:ZIP...
    packageimg
  • Variations_Based_斯洛伐克语附着词位置变异研究数据集

    2026年1月23日 30 128 99

    数据集概述 本数据集为论文“Variations on positioning of clitics in Slovak (on the basis of corpus and experimental data)”配套数据,核心内容围绕斯洛伐克语中附着词的位置变异展开,基于语料库和实验数据构建,包含一个文件,用于支撑相关语言学研究分析。 文件详解...
    packageimg
  • IN01002_Based_Rajim_Temple建造梵语XML数据

    2026年1月23日 30 174 124

    数据集概述 本数据集包含关于Rajim Temple的Vilasatunga建造相关的梵语文献XML文件,无元数据信息。数据集仅含一个文件,无目录层级,文件类型单一为XML格式,未划分训练/测试、数据/标签或原始/处理数据等子集。 文件详解 文件名称:IN01002.xml 文件格式:XML 字段映射介绍:文件为梵语文本内容,包含Rajim...
    packageimg
  • IN02045_Sanskrit_Epidoc梵语石刻铭文草稿XML数据

    2026年1月21日 30 56 21

    数据集概述 本数据集为阿姆苏瓦尔马(Amsuvarma)的布格马蒂(Bungmati)石刻铭文(编号IN02045)的梵语文本数字化数据,采用Epidoc格式的XML文件存储(无元数据),是拟纳入"Siddham"档案的草稿版本,用于印度古代碑铭文献的数字化保存与研究。 文件详解 文件名称:IN02045.xml 文件格式:XML...
    packageimg
  • ElarArchive_dk0071_Dalabon语言占位词使用偏好数据

    2026年1月21日 30 44 15

    数据集概述 本数据集来自Ponsonnet的Dalabon语料库,记录了澳大利亚Gunwinyguan语系Dalabon语言中占位词keninjhbi及其变体的使用实例,用于研究该语言中占位词使用的个体偏好特征,包含2个数据文件。 文件详解 文件名称:Ponsonnet data set 2401026.ods 文件格式:ODS...
    packageimg
  • IMTVault_Based_低资源语言语际标注文本提取与富集数据集_2022

    2026年1月19日 30 180 36

    数据集概述 本数据集为IMTVault,主要内容是从语法描述和类型学调查文章中提取并富集的低资源语言语际标注文本。数据集由1个压缩文件构成,无训练测试、数据标签或原始处理数据的拆分,适用于低资源语言的语言学研究与资源开发。 文件详解 文件名称:cldf-datasets/imtvault-v1.2.zip 文件格式:ZIP...
    packageimg
  • IN01012_Sanskrit_XML格式Jayaraja_Arang宪章文本数据

    2026年1月18日 30 126 43

    数据集概述 本数据集包含IN01012编号对应的Jayaraja Arang宪章的梵语文本,以XML格式存储,无元数据。数据集仅含一个文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理数据,是研究古代梵语历史文献的基础文本资源。 文件详解 文件名称:IN01012.xml 文件格式:XML...
    packageimg
  • IN02054_Sanskrit_XML阿姆苏瓦尔马水库铭文梵语文本数据_Draft

    2026年1月18日 30 71 47

    数据集概述 本数据集包含阿姆苏瓦尔马水库铭文(IN02054)的梵语XML文件,为Epidoc格式草稿版本,将纳入"Siddham"档案。数据核心为铭文文本内容,无元数据,仅含一个XML文件,用于铭文研究与数字化存档。 文件详解 文件名称:IN02054.xml 文件格式:XML...
    packageimg
  • IN01048_Based_Mrgesavarman_Banavasi碑铭梵语XML文本数据

    2026年1月17日 30 210 92

    数据集概述 本数据集包含IN01048号Banavasi碑铭(Mrgesavarman时期)的梵语文本XML文件,无附加元数据。数据为单一文件,直接记录碑铭的梵语内容,是研究古代印度碑铭文献、梵语语言及历史文化的基础数字化资源。 文件详解 文件名称:IN01048.xml 文件格式:XML...
    packageimg
  • IN02019_Based_Pasupati_Sivalinga底座梵语XML草案数据

    2026年1月14日 30 185 31

    数据集概述 本数据集为IN02019号文物(Abhiri的Pasupati Sivalinga底座)的梵语文本XML文件,采用Epidoc格式草案版本,无元数据,计划纳入"Siddham"档案。数据核心为该梵语铭文的数字化文本,支持考古与梵语文献研究。 文件详解 文件名称:IN02019.xml 文件格式:XML...
    packageimg
  • IN01050_Based_Santivarman_Talagunda碑铭梵语XML文本数据

    2026年1月12日 30 103 39

    数据集概述 本数据集包含Santivarman的Talagunda碑铭(编号IN01050)的梵语文本XML文件,无附加元数据。数据核心为该碑铭的数字化文本内容,支持碑铭文献的数字化研究与文本分析,仅包含一个XML文件。 文件详解 文件名称:IN01050.xml 文件格式:XML...
    packageimg
  • IN01042_Sanskrit_XML格式Ravivarman的Nilambur授权文件数据

    2026年1月12日 30 90 0

    数据集概述 本数据集为IN01042编号的《Ravivarman的Nilambur授权文件》梵语文本的XML格式文件,无元数据信息。数据集仅包含1个XML文件,未进行训练/测试、数据/标签或原始/处理等划分,专注于提供该历史授权文件的数字化文本内容。 文件详解 XML数据文件 文件名称:IN01042.xml 文件格式:XML...
    packageimg
  • IN02003_Sanskrit_Based_昌古纳拉扬石柱西轴铭文梵语XML数据_draft

    2026年1月11日 30 134 47

    数据集概述 本数据集包含IN02003昌古纳拉扬石柱西轴铭文的梵语文本数据,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份核心XML文件,用于铭文文本的数字化保存与研究。 文件详解 文件名称:IN02003.xml 文件格式:XML...
    packageimg
  • IN01001_Based_Bhavattavarman的Rithapur宪章梵语XML文本数据

    2026年1月7日 30 12 5

    数据集概述 本数据集包含IN01001编号的《Bhavattavarman的Rithapur宪章》梵语文本数据,以XML格式存储,无元数据。数据集仅含一个文件,文件结构扁平化,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:IN01001.xml 文件格式:XML...
    packageimg
  • Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

    2026年1月7日 30 182 109

    数据集概述 本数据集为Multi-CAST多语言语音文本标注语料库的一部分,包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布,是多语言口语文本标注资源的重要组成,可用于相关语言研究与自然语言处理应用。 文件详解 文件名称:Multi-CAST/mcnkurd-v2311.zip 文件格式:ZIP...
    packageimg
  • IN01040_Sanskrit_Based_Mrgesavarman第7年授权文书梵语XML数据

    2026年1月6日 30 67 44

    数据集概述 本数据集包含IN01040号Hiṭnahebbāgilu地区Mṛgeśavarman第7年授权文书的梵语文本XML文件,无元数据。文件数量为1,未划分训练/测试集、数据/标签集或原始/处理集,主要用于梵语历史文献的数字化存储与分析。 文件详解 梵语授权文书文件 文件名称:IN01040.xml 文件格式:XML...
    packageimg
  • 杜洪比语引出笔记数据集

    2025年12月22日 30 174 65

    数据集概述 本数据集包含《杜洪比语语法》(Brill,2019)相关的引出笔记PDF文件,配有原始音频文件(DOI 10.5281/zenodo.1406852)。引出会话主要使用仓洛语和杜洪比语,笔记中的分析内容与最终语法描述可能存在差异。 文件详解...
    packageimg
  • Adham_Berdimurodov_Musurmonovich_Inkorn_Based_Inkorn表达词词汇语法特征完整数据

    2025年12月21日 30 135 94

    数据集概述 该数据集包含一份关于“Inkorn表达词的词汇-语法特征”的文档,聚焦于特定词汇的语言学属性分析,为相关语言研究提供资料支持。 文件详解 文件名称: Adham Berdimurodov Musurmonovich.pdf 文件格式: PDF (.pdf) 内容说明: 文档围绕“Inkorn表达词的词汇-...
    packageimg