-
IN02031_Sanskrit_XML草稿版Tulacchentole铭文_Epidoc格式
数据集概述 本数据集包含IN02031 Tulacchentole铭文的梵语XML文件,为Epidoc格式的草稿版本,不含元数据,计划纳入“Siddham”档案。数据集仅含一个文件,无目录层级,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:IN02031.xml 文件格式:XML...
-
Siddham_Based_IN02080_Yengu_Bahaltole梵语碑文XML草稿数据
数据集概述 本数据集包含IN02080 Yengu Bahaltole碑铭的梵语XML文件,为Epidoc格式草稿版本,无元数据,计划纳入"Siddham"档案。数据集仅含一个文件,可用于碑铭文献数字化研究与梵语碑文文本分析。 文件详解 文件名称:IN02080.xml 文件格式:XML...
-
IN02072_Siddham_Based_Narendradeva耶恩加希提铭文梵语XML草稿数据
数据集概述 本数据集为IN02072号Narendradeva耶恩加希提铭文的梵语XML文件,是待纳入Siddham档案的Epidoc格式草稿版本,不含元数据。数据集仅包含1个文件,聚焦于该古铭文的数字化文本记录。 文件详解 文件名称:IN02072.xml 文件格式:XML...
-
哥廷根印度语言电子文本注册库_罗摩衍那数据集
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
-
哥廷根印度语言电子文本登记册_HTML数据集
数据集概述 该数据集是哥廷根印度语言电子文本登记册(GRETIL)的HTML格式文本集合,包含101个印度语言电子文本文件和1个样式表文件,涵盖梵语等印度语言的宗教、哲学、文学类文本,为印度语言文献研究提供基础资料。 文件详解 印度语言电子文本文件(共101个): 文件格式:HTML(.htm) 示例文件:pAda-index_sa-...
-
僧伽罗语梵语数字词汇表2_0_A至M
数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
-
僧伽罗语梵语数字词汇表202_字母N至Z
数据集概述 本数据集为僧伽罗语梵语数字词汇表第二版,聚焦字母N至Z的词汇内容,包含结构化数据文件与文档文件,为研究僧伽罗语梵语词汇提供基础数据支持。 文件详解 文件名称:Sinhala Prakrit, A-M.ods 文件格式:ods 内容说明:可能包含僧伽罗语梵语字母A至M相关的词汇数据,以电子表格形式存储 文件名称:Sinhala...
-
东汉晚期佛教术语汉译转写数据集
数据集概述 该数据集汇集了东汉晚期译者的佛教术语汉译转写资料,整合了多位学者的研究成果,补充了东汉汉语、中古汉语的语音重构及犍陀罗语对应词,为研究东汉汉语语音、汉译来源语言及目标方言语音提供支持。 文件详解 文件名称: Dataset Description.pdf,文件格式: PDF,内容: 数据集描述文档,可能包含数据背景、构建方法等说明...
-
哥廷根印度语言电子文本注册库_罗摩衍那数据集
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
-
维哈雷加拉石刻铭文数据集1_1
数据集概述 本数据集为维哈雷加拉石刻铭文(版本1.1),包含公元1至2世纪的两处梵语铭文,分别属于萨巴王(Subha)和伽贾巴胡·伽马尼·阿巴亚王时期,记录了对埃卡德瓦拉修道院的水池捐赠信息。 文件详解 文件名称: Lanka IN03003 version 1.1.pdf 文件格式: PDF (.pdf) 文件内容:...
-
梵语词分割数据集
数据集概述 该数据集针对梵语词分割任务构建,包含约十一万五千个句子,每个句子提供输入字符序列、真实分割结果及所有语音可能分割的词汇和形态信息,为梵语手稿的句法与语义处理提供基础数据支持。 文件详解 该数据集包含七个文件,具体说明如下: - 压缩文件: - DCS_pick.zip:压缩文件,可能包含实验相关的Pickle格式数据 -...
-
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary 数据来源:互联网公开数据 标签:梵语, 语言学, 文本分析, 词汇, 文化研究, 古典语言, 文本挖掘, 印度文化 数据概述: 该数据集包含来自互联网的梵语词汇,记录了梵语单词的文本数据。主要特征如下:...
-
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N....
-



