找到19个数据集

标签: 梵语

过滤结果
  • Sinhala_Prakrit_Source_僧伽罗语梵语悉昙字母Ā数字词汇表数据1_0版

    2026年1月13日 30 17 16

    数据集概述 本数据集为僧伽罗语梵语悉昙数字词汇表的字母Ā版本(1.0版),包含与悉昙字母Ā相关的词汇数据,以单一Excel文件形式呈现,无目录结构和数据分割,是悉昙文字研究的基础词汇资源。 文件详解 文件名称:Sinhala Prakrit 1.0.xlsx 文件格式:XLSX...
    packageimg
  • IN02049_Sanskrit_Gungucha碑铭Epidoc格式XML数据_Draft

    2026年1月12日 30 146 55

    数据集概述 本数据集为加德满都Gungucha碑铭(编号IN02049)的梵语文本XML文件,采用Epidoc格式的草稿版本,将纳入"Siddham"档案。数据包含碑铭的数字化文本内容,无元数据,是研究该碑铭文献的基础数字化资源。 文件详解 文件名称:IN02049.xml 文件格式:XML...
    packageimg
  • IN01050_Based_Santivarman_Talagunda碑铭梵语XML文本数据

    2026年1月12日 30 7 6

    数据集概述 本数据集包含Santivarman的Talagunda碑铭(编号IN01050)的梵语文本XML文件,无附加元数据。数据核心为该碑铭的数字化文本内容,支持碑铭文献的数字化研究与文本分析,仅包含一个XML文件。 文件详解 文件名称:IN01050.xml 文件格式:XML...
    packageimg
  • IN02047_Siddham_Deopatan梵语铭文Epidoc格式XML数据_draft

    2026年1月11日 30 209 84

    数据集概述 本数据集为IN02047 Deopatan铭文的初步Epidoc格式梵语XML文件,不含元数据,计划纳入“Siddham”档案。数据核心为该铭文的数字化文本,支持铭文文献的标准化存储与研究,仅包含一个文件。 文件详解 文件名称:IN02047.xml 文件格式:XML...
    packageimg
  • IN02030_Source_Siddham档案Golmadhitole铭文梵语XML草稿数据

    2026年1月11日 30 124 84

    数据集概述 本数据集包含IN02030 Golmadhitole铭文的梵语XML文件,为Epidoc格式的草稿版本,将纳入"Siddham"档案。数据核心是该铭文的数字化文本内容,无额外元数据,支持铭文文献的数字化研究与存档。 文件详解 文件名称:IN02030.xml 文件格式:XML...
    packageimg
  • IN02031_Sanskrit_XML草稿版Tulacchentole铭文_Epidoc格式

    2026年1月11日 30 80 45

    数据集概述 本数据集包含IN02031 Tulacchentole铭文的梵语XML文件,为Epidoc格式的草稿版本,不含元数据,计划纳入“Siddham”档案。数据集仅含一个文件,无目录层级,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:IN02031.xml 文件格式:XML...
    packageimg
  • Siddham_Based_IN02080_Yengu_Bahaltole梵语碑文XML草稿数据

    2026年1月9日 30 47 16

    数据集概述 本数据集包含IN02080 Yengu Bahaltole碑铭的梵语XML文件,为Epidoc格式草稿版本,无元数据,计划纳入"Siddham"档案。数据集仅含一个文件,可用于碑铭文献数字化研究与梵语碑文文本分析。 文件详解 文件名称:IN02080.xml 文件格式:XML...
    packageimg
  • IN02072_Siddham_Based_Narendradeva耶恩加希提铭文梵语XML草稿数据

    2026年1月5日 30 144 101

    数据集概述 本数据集为IN02072号Narendradeva耶恩加希提铭文的梵语XML文件,是待纳入Siddham档案的Epidoc格式草稿版本,不含元数据。数据集仅包含1个文件,聚焦于该古铭文的数字化文本记录。 文件详解 文件名称:IN02072.xml 文件格式:XML...
    packageimg
  • 哥廷根印度语言电子文本注册库_罗摩衍那数据集

    2025年12月25日 30 148 87

    数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
    packageimg
  • 哥廷根印度语言电子文本登记册_HTML数据集

    2025年12月19日 30 68 13

    数据集概述 该数据集是哥廷根印度语言电子文本登记册(GRETIL)的HTML格式文本集合,包含101个印度语言电子文本文件和1个样式表文件,涵盖梵语等印度语言的宗教、哲学、文学类文本,为印度语言文献研究提供基础资料。 文件详解 印度语言电子文本文件(共101个): 文件格式:HTML(.htm) 示例文件:pAda-index_sa-...
    packageimg
  • 僧伽罗语梵语数字词汇表2_0_A至M

    2025年12月23日 30 52 3

    数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 僧伽罗语梵语数字词汇表202_字母N至Z

    2025年12月20日 30 68 64

    数据集概述 本数据集为僧伽罗语梵语数字词汇表第二版,聚焦字母N至Z的词汇内容,包含结构化数据文件与文档文件,为研究僧伽罗语梵语词汇提供基础数据支持。 文件详解 文件名称:Sinhala Prakrit, A-M.ods 文件格式:ods 内容说明:可能包含僧伽罗语梵语字母A至M相关的词汇数据,以电子表格形式存储 文件名称:Sinhala...
    packageimg
  • 东汉晚期佛教术语汉译转写数据集

    2025年12月20日 30 95 10

    数据集概述 该数据集汇集了东汉晚期译者的佛教术语汉译转写资料,整合了多位学者的研究成果,补充了东汉汉语、中古汉语的语音重构及犍陀罗语对应词,为研究东汉汉语语音、汉译来源语言及目标方言语音提供支持。 文件详解 文件名称: Dataset Description.pdf,文件格式: PDF,内容: 数据集描述文档,可能包含数据背景、构建方法等说明...
    packageimg
  • 哥廷根印度语言电子文本注册库_罗摩衍那数据集

    2025年12月10日 0 80 64

    数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
    packageimg
  • 维哈雷加拉石刻铭文数据集1_1

    2025年12月5日 30 187 143

    数据集概述 本数据集为维哈雷加拉石刻铭文(版本1.1),包含公元1至2世纪的两处梵语铭文,分别属于萨巴王(Subha)和伽贾巴胡·伽马尼·阿巴亚王时期,记录了对埃卡德瓦拉修道院的水池捐赠信息。 文件详解 文件名称: Lanka IN03003 version 1.1.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 梵语词分割数据集

    2025年12月4日 30 86 4

    数据集概述 该数据集针对梵语词分割任务构建,包含约十一万五千个句子,每个句子提供输入字符序列、真实分割结果及所有语音可能分割的词汇和形态信息,为梵语手稿的句法与语义处理提供基础数据支持。 文件详解 该数据集包含七个文件,具体说明如下: - 压缩文件: - DCS_pick.zip:压缩文件,可能包含实验相关的Pickle格式数据 -...
    packageimg
  • 梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary

    2025年5月1日 30 60 3

    梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary 数据来源:互联网公开数据 标签:梵语, 语言学, 文本分析, 词汇, 文化研究, 古典语言, 文本挖掘, 印度文化 数据概述: 该数据集包含来自互联网的梵语词汇,记录了梵语单词的文本数据。主要特征如下:...
    packageimg
  • 梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集

    2025年4月15日 30 137 6

    梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N....
    packageimg
  • 梵语文本生成与摘要研究数据集

    2025年4月14日 30 121 39

    梵语文本生成与摘要研究数据集 数据来源:互联网公开数据 标签:梵语,文本生成,新闻摘要,语言学,数据增强,文本处理 数据概述:...
    packageimg