-
KOLLMEIER_Based汉印佛教词汇比较对照数据
2026年1月30日 30 122 7
数据集概述 本数据集为汉印佛教词汇比较对照表,聚焦汉语与印度语系佛教词汇的对比研究,包含一份核心文件,可用于语言学、宗教学领域的词汇语义分析与跨语言对比研究。 文件详解 文件名称:KOLLMEIER version 1.xlsx 文件格式:XLSX...
-
IN02078_Siddham_梵语铭文Epidoc草稿XML
2026年1月28日 30 169 133
数据集概述 本数据集为IN02078 Cyasaltole铭文的梵语XML文件,是拟纳入“Siddham”档案的Epidoc格式草稿版,不含元数据。数据集仅包含一个文件,用于呈现该铭文的数字化文本内容,支持古文字研究与数字化存档。 文件详解 文件名称:IN02078.xml 文件格式:XML...
-
Objaverse_Source_Manilla历史物品数字化数据
2026年1月27日 30 57 6
数据集概述 本数据集包含Manilla物品的数字化资源,Manilla起源于殖民时期前非洲卡拉巴尔沿海王国,由铜或青铜制成,在西非作为货币和装饰品使用至20世纪40年代末。数据集含6个文件,涵盖图像与三维模型格式。 文件详解 图像文件(Raster files)...
-
基于柏林国家图书馆历史报纸的OCR_OLR系统训练与评估真实数据集
2026年1月27日 30 63 59
数据集概述 本数据集包含柏林国家图书馆50页数字化历史报纸的真值数据,用于OCR/OLR系统的训练与评估,由欧盟ICT-PSP项目Europeana Newspapers产出。数据集含PAGE-XML格式真值文件、全分辨率及二值化扫描图像、对应OCR结果等5个压缩包,为历史报纸文本识别技术提供标准化测试资源。 文件详解 gt_page.zip...
-
IN01011_Source_Sudevaraja宪章梵语XML数据
2026年1月23日 30 78 34
数据集概述 本数据集包含IN01011号Sudevaraja的Sirpur宪章梵语文本,以XML格式存储,无元数据。数据集仅含一个文件,无目录层级划分,无训练/测试、数据/标签或原始/处理数据的拆分,文件类型单一为XML。 文件详解 文件名称:IN01011.xml 文件格式:XML...
-
IN01015_Sanskrit_Dhamatari特许状文本XML数据
2026年1月21日 30 195 116
数据集概述 本数据集为Sudevaraja的Dhamatari特许状的梵语文本数字化文件,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一为XML。 文件详解 文件名称:IN01015.xml 文件格式:XML...
-
AmadissigloXX_Based_银玫瑰_现代重写文献数据库_v1_2
2026年1月20日 30 138 123
数据集概述 本数据集是AmadissigloXX项目的一部分,收录索莱达·普埃尔托拉斯1999年作品《银玫瑰》的现代重写文献数据。包含元数据与完整数据库两类文件,覆盖作品基本信息、情节梗概、骑士文学来源及批评文献等内容,支持古典文学现代改编研究。 文件详解 JSON文件(5103.json) 文件格式:JSON 字段映射介绍:包含id、record-...
-
IN02029_EpiDoc_Bhimasena_Temple梵语铭文草案XML数据
2026年1月18日 30 138 36
数据集概述 本数据集包含编号为IN02029的Bhimasena Temple铭文的梵语XML文件,为EpiDoc格式的草案版本,将纳入"Siddham"档案。文件未包含元数据,仅涉及铭文内容的数字化记录,是研究该古铭文的基础数据资源。 文件详解 文件名称:IN02029.xml 文件格式:XML...
-
HTR_Winter_School_2023_2024_加洛林拉丁语手稿转录基准数据
2026年1月18日 30 36 21
数据集概述 本数据集是HTR Winter School 2023/2024加洛林拉丁语小组发布的转录基准数据,包含维也纳奥地利国家图书馆Cod. 473(《教皇史》部分内容)和Cod. 1239(带注释的保罗书信)的转录文本,分为带注释和不带注释两种版本,并提供Cod. 473的对应图像文件,遵循Tim Geelhaar的加洛林小写字母转录规范。...
-
IN01063_梵语_XML_Śivaḷḷi_克里希纳瓦尔曼二世的赠予_梵语文献数据
2026年1月18日 30 191 101
数据集概述 本数据集包含编号IN01063的Śivaḷḷi Grant文献,为Kṛṣṇavarman II统治第22年的梵语铭文数字化内容。数据以XML格式存储,无额外元数据,仅包含一份核心文件,是研究古代梵语铭文及历史文化的基础资料。 文件详解 文件名称:IN01063.xml 文件格式:XML 字段映射介绍:为Śivaḷḷi...
-
IN02021_Based_Lagantole_Avalokitesvara梵语XML草稿版
2026年1月17日 30 140 41
数据集概述 本数据集为IN02021 Lagantole Avalokitesvara底本的梵语XML文件,属于未包含元数据的Epidoc格式草稿版,拟纳入"Siddham"档案。数据集仅含1个XML文件,无目录层级,无训练/测试、数据/标签、原始/处理数据拆分,聚焦于梵语文本的数字化呈现。 文件详解 文件名称:IN02021.xml 文件格式:XML...
-
IN02076_Siddham归档_Patan_Gairidhara碑铭梵语XML数据
2026年1月14日 30 106 72
数据集概述 本数据集为Patan地区Gairidhara碑铭(编号IN02076)的梵语文本XML文件,是Epidoc格式的草稿版本,计划纳入"Siddham"档案库。数据无元数据,仅包含碑铭文本内容,共1个文件。 文件详解 文件名称:IN02076.xml 文件格式:XML...
-
Scarlet_Gown_Based_Robert_Murray诗歌编码数据_2022
2026年1月14日 30 42 27
数据集概述 本数据集是Robert Fuller Murray所著《The Scarlet Gown》第二版中诗歌《Adventure of a Poet》的有效XML-TEI编码数据,由帕多瓦大学数字文献学课程于2022年春季制作,包含1个XML文件。 文件详解 文件名称:Robert_Murray_P2P13_JG_2022_05_20.xml...
-
Ugarit_Based_阿尔特米多鲁斯_解梦_第五卷希腊_葡萄牙语对齐翻译数据_V2
2026年1月14日 30 155 31
数据集概述 本数据集包含阿尔特米多鲁斯《解梦》第五卷的希腊原文与葡萄牙语译文对齐版本,涵盖95章正文及分为四部分的序言,共99个文件。数据基于Pack 1963年希腊文版本和2014年葡萄牙语译文修订版,通过Ugarit平台对齐,是巴西圣保罗州立大学数字古典学开放项目的一部分。 文件详解 对齐翻译文件(XML格式)...
-
Siddham_Epigraphic_Archive_悉昙碑铭档案元数据与参考文献存档数据
2026年1月13日 30 2 0
数据集概述 本数据集为悉昙碑铭语料库预发布元数据及元数据中引用的参考文献的存档版本,包含2017年至2019年的多个版本,共6个文件,将通过在线数据库https://siddham.network/开放获取,是悉昙碑铭研究的重要文献参考资料。 文件详解 文件名称:Siddham metadata 20190130.xlsx、Siddham...
-
musiXplora_Based_George_Butler_b3555_音乐人物档案数据
2026年1月12日 30 205 185
数据集概述 本数据集为音乐人物George Butler(musiXplora-ID:b3555)的结构化档案数据,包含其基础信息、职业领域、活动地点、相关事件及来源等内容,是研究音乐人物历史档案的参考资料。 文件详解 文件名称:b3555_DE.json 文件格式:JSON...
-
IN02070_Epidoc_Siddham档案待整合Yampibahi铭文梵语XML草稿
2026年1月12日 30 55 1
数据集概述 本数据集包含IN02070 Yampibahi铭文的梵语XML文件,为Epidoc格式草稿版,无元数据,计划纳入“Siddham”档案。数据集仅含1个文件,无目录层级、训练测试/数据标签/原始处理拆分,文件类型单一为XML。 文件详解 文件名称:IN02070.xml 文件格式:XML...
-
IN01035_Sanskrit_Bennur_Krsnavarman_II授权文书XML数据
2026年1月12日 30 144 96
数据集概述 本数据集包含编号为IN01035的Bennur Grant of Kṛṣṇavarman II梵语XML文件,未包含元数据。文件记录了Kṛṣṇavarman II的授权文书内容,为研究古代梵语历史文献提供原始文本数据支持,数据集仅有一个文件。 文件详解 文件名称:IN01035.xml 文件格式:XML...
-
IN01042_Sanskrit_XML格式Ravivarman的Nilambur授权文件数据
2026年1月12日 30 170 37
数据集概述 本数据集为IN01042编号的《Ravivarman的Nilambur授权文件》梵语文本的XML格式文件,无元数据信息。数据集仅包含1个XML文件,未进行训练/测试、数据/标签或原始/处理等划分,专注于提供该历史授权文件的数字化文本内容。 文件详解 XML数据文件 文件名称:IN01042.xml 文件格式:XML...
-
IN02062_EpiDoc_Bhimarjunadeva_Thankot铭文梵语XML草稿数据
2026年1月9日 30 113 14
数据集概述 本数据集包含IN02062编号的Bhimarjunadeva Thankot铭文的梵语文本数据,以XML格式存储,为EpiDoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份文件,用于铭文文献的数字化保存与研究。 文件详解 文件名称:IN02062.xml 文件格式:XML...



