找到20个数据集

标签: 梵语语言学

过滤结果
  • IN01015_Sanskrit_Dhamatari特许状文本XML数据

    2026年1月21日 30 71 63

    数据集概述 本数据集为Sudevaraja的Dhamatari特许状的梵语文本数字化文件,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一为XML。 文件详解 文件名称:IN01015.xml 文件格式:XML...
    packageimg
  • IN02045_Sanskrit_Epidoc梵语石刻铭文草稿XML数据

    2026年1月21日 30 66 36

    数据集概述 本数据集为阿姆苏瓦尔马(Amsuvarma)的布格马蒂(Bungmati)石刻铭文(编号IN02045)的梵语文本数字化数据,采用Epidoc格式的XML文件存储(无元数据),是拟纳入"Siddham"档案的草稿版本,用于印度古代碑铭文献的数字化保存与研究。 文件详解 文件名称:IN02045.xml 文件格式:XML...
    packageimg
  • IN02028_Based_Siddham档案待整合_梵语碑文铭文XML草案数据

    2026年1月19日 30 138 31

    数据集概述 本数据集为IN02028 Cyasaltole Patan碑刻铭文的梵语XML文件,是Epidoc格式的草案版本,不含元数据,计划纳入"Siddham"档案。数据记录了该碑刻铭文的数字化文本内容,为古文字学、梵语研究提供基础资料。 文件详解 文件名称:IN02028.xml 文件格式:XML...
    packageimg
  • IN01056_Sanskrit_XML_拉维瓦尔曼授予金德拉的哈尔西特许状石刻数据

    2026年1月18日 30 161 3

    数据集概述 本数据集包含编号IN01056的哈尔西特许状(共3块石刻)的梵语文本XML文件,记录拉维瓦尔曼对金德拉的授予内容。数据无元数据,仅含1个XML文件,用于古文献数字化研究与梵语铭文分析。 文件详解 核心文件 文件名称:IN01056.xml 文件格式:XML...
    packageimg
  • IN02026_EpiDoc_Siddham档案Hari_Hara基座铭文梵语XML草稿数据

    2026年1月17日 30 7 6

    数据集概述 本数据集为IN02026 Hari-Hara基座铭文的梵语XML文件,是EpiDoc格式的草稿版本,计划纳入“Siddham”档案。数据不含元数据,仅包含一份XML文件,记录该铭文的文本内容,适用于梵语铭文的数字化研究与文献整理。 文件详解 文件名称:IN02026.xml 文件格式:XML...
    packageimg
  • IN01029_Based古印度Māndhātṛvarman授权令梵语XML数据

    2026年1月15日 30 19 11

    数据集概述 本数据集包含古印度铭文IN01029(Kūḍgere Grant of Māndhātṛvarman,Year 2)的梵语文本XML文件,无元数据。数据集仅含一个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,文件类型为XML格式。 文件详解 文件名称:IN01029.xml 文件格式:XML...
    packageimg
  • IN01033_Sanskrit_XML_Devarahalli授权文书梵语文本

    2026年1月15日 30 100 63

    数据集概述 本数据集包含IN01033编号的Devarahalli授权文书(Mandhatrraja统治第5年)的梵语XML文件,无附加元数据。文件记录了该历史授权文书的原始梵语文本内容,为研究古代梵语铭文和历史授权制度提供数字化文本资源。 文件详解 文件名称:IN01033.xml 文件格式:XML...
    packageimg
  • IN02084_源文件_悉达摩字母档案_湿婆德瓦二世_索纳古提石刻铭文梵语XML草稿版

    2026年1月14日 30 150 118

    数据集概述 本数据集包含IN02084编号的Sivadeva II时期Sonaguthi石刻铭文的梵语XML文件,为Epidoc格式草稿版,将纳入“Siddham”档案。数据无元数据,仅含1个XML文件,聚焦石刻铭文的数字化文本内容,用于梵语铭文文献的研究与存档。 文件详解 文件名称:IN02084.xml 文件格式:XML...
    packageimg
  • IN01009_Source_Sudevaraja的Sarangarh宪章梵语XML数据

    2026年1月13日 30 198 103

    数据集概述 本数据集包含一份Sudevaraja的Sarangarh宪章梵语文献的XML文件,文件无元数据,仅记录核心文献内容。数据集结构简单,无目录层级,文件类型单一,总计1个文件,可用于梵语铭文文献的数字化研究与文本分析。 文件详解 文件名称:IN01009.xml 文件格式:XML...
    packageimg
  • IN01019_Sanskrit_Jayaraja王第9年Mallar诏书梵语XML文件

    2026年1月13日 30 103 80

    数据集概述 本数据集包含IN01019号Jayaraja王第9年Mallar诏书的梵语XML文件,是一份无元数据的历史文献数字化资料,可用于研究古代印度诏书的文本内容与语言特征。 文件详解 文件名称:IN01019.xml 文件格式:XML 字段映射介绍:包含Jayaraja王第9年Mallar诏书的梵语文本内容,无额外元数据信息。 适用场景...
    packageimg
  • IN02091_Sanskrit_Epidoc草案版Tungahiti石刻铭文XML数据

    2026年1月13日 30 78 33

    数据集概述 本数据集为IN02091号Tungahiti石刻铭文的梵语XML文件,是采用Epidoc格式的草案版本,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个XML文件,无目录层级,无训练/测试、数据/标签、原始/处理数据的划分。 文件详解 文件名称:IN02091.xml 文件格式:XML...
    packageimg
  • Sinhala_Prakrit_Source_僧伽罗语梵语悉昙字母Ā数字词汇表数据1_0版

    2026年1月13日 30 39 18

    数据集概述 本数据集为僧伽罗语梵语悉昙数字词汇表的字母Ā版本(1.0版),包含与悉昙字母Ā相关的词汇数据,以单一Excel文件形式呈现,无目录结构和数据分割,是悉昙文字研究的基础词汇资源。 文件详解 文件名称:Sinhala Prakrit 1.0.xlsx 文件格式:XLSX...
    packageimg
  • IN01050_Based_Santivarman_Talagunda碑铭梵语XML文本数据

    2026年1月12日 30 10 2

    数据集概述 本数据集包含Santivarman的Talagunda碑铭(编号IN01050)的梵语文本XML文件,无附加元数据。数据核心为该碑铭的数字化文本内容,支持碑铭文献的数字化研究与文本分析,仅包含一个XML文件。 文件详解 文件名称:IN01050.xml 文件格式:XML...
    packageimg
  • IN01021_Source_桑戈利Harivarman_8年特许状梵语XML数据_原始文本

    2026年1月12日 30 125 122

    数据集概述 本数据集包含IN01021号桑戈利地区Harivarman统治8年的特许状梵语文本,以XML格式存储,无附加元数据。数据集仅含1个文件,无目录层级,未划分训练/测试、数据/标签或原始/处理版本,是研究古代印度特许状文献的基础文本资源。 文件详解 文件名称:IN01021.xml 文件格式:XML...
    packageimg
  • IN01042_Sanskrit_XML格式Ravivarman的Nilambur授权文件数据

    2026年1月12日 30 25 7

    数据集概述 本数据集为IN01042编号的《Ravivarman的Nilambur授权文件》梵语文本的XML格式文件,无元数据信息。数据集仅包含1个XML文件,未进行训练/测试、数据/标签或原始/处理等划分,专注于提供该历史授权文件的数字化文本内容。 文件详解 XML数据文件 文件名称:IN01042.xml 文件格式:XML...
    packageimg
  • IN02034_Based_Satungal碑铭Sanskrit文本XML草稿数据_EpiDoc版

    2026年1月7日 30 158 8

    数据集概述 本数据集包含Satungal碑铭(编号IN02034)的Sanskrit文本XML文件,为EpiDoc格式草稿版,将被纳入“Siddham”档案。数据无元数据,仅含1个核心文件,用于碑铭文献的数字化存储与研究。 文件详解 文件名称:IN02034.xml 文件格式:XML...
    packageimg
  • 哥廷根印度语言电子文本注册库_摩诃婆罗多节选

    2025年12月14日 30 22 0

    数据集概述 该数据集是哥廷根印度语言电子文本注册库(GRETIL)收录的《摩诃婆罗多》节选内容,包含十七个HTML格式文件,未进行训练测试、数据标签或原始/处理数据的拆分,所有文件均为网页格式,无额外说明文档或内容预览。 文件详解...
    packageimg
  • 哥廷根印度语言电子文本注册库_数论派文献集

    2025年12月8日 30 187 92

    数据集概述 该数据集是哥廷根印度语言电子文本注册库(GRETIL)的一部分,聚焦于印度哲学数论派(SAṂKHYA)相关文献,包含十八个HTML格式文件,未区分训练测试、数据标签或原始处理数据。 文件详解 核心文件: 文件类型: 所有文件均为HTML格式(.htm),共十八个文件 文件示例:...
    packageimg
  • 维哈雷加拉石刻铭文数据集1_1

    2025年12月5日 30 47 25

    数据集概述 本数据集为维哈雷加拉石刻铭文(版本1.1),包含公元1至2世纪的两处梵语铭文,分别属于萨巴王(Subha)和伽贾巴胡·伽马尼·阿巴亚王时期,记录了对埃卡德瓦拉修道院的水池捐赠信息。 文件详解 文件名称: Lanka IN03003 version 1.1.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 佛教梵语嵌入模型评估数据集

    2025年12月4日 30 105 77

    数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...
    packageimg