-
IN00609_Source_古代Siladiya授予Mahadeva文献数据
数据集概述 本数据集包含一份编号为IN00609的古代文献,内容为Siladiya在290年授予Mahadeva的相关记录。数据集仅含1个XML格式文件,无目录层级划分,未进行训练测试、数据标签或原始处理等拆分,文件类型单一。 文件详解 文件名称:IN00609 XML.xml 文件格式:XML...
-
Oxford_Merton_MS_249_Bestiaire抄写缩写研究数据集
数据集概述 本数据集为牛津默顿学院图书馆MS 249号手稿(《Bestiaire》)1r至10v页的抄写缩写研究配套数据,包含3个文件,涵盖缩写判定标准、文本转写编码及缩写统计分析,用于中世纪手稿抄写缩写模式的学术研究。 文件详解...
-
IN01016_Source_Sudevaraja的Nahna宪章梵语XML文献数据
数据集概述 本数据集包含IN01016号Sudevaraja的Nahna宪章梵语文献,以XML格式存储,无附加元数据。数据集仅含一个文件,无目录层级结构,未划分训练/测试集、数据/标签集或原始/处理集,文件类型单一为XML格式。 文件详解 文件名称:IN01016.xml 文件格式:XML...
-
IN01005_Based_Pravararaja君主Mallar宪章梵语XML数据
数据集概述 本数据集包含IN01005号Pravararaja君主Mallar宪章的梵语XML文件,未附带元数据。数据集仅含一个文件,无目录层级划分,无训练测试、数据标签或原始/处理数据的拆分。 文件详解 文件名称:IN01005.xml 文件格式:XML...
-
Lichen_Flora_Based_大索诺兰沙漠地区地衣区系第一卷数据_2007版
数据集概述 本数据集对应《大索诺兰沙漠地区地衣区系:第一卷》,由Nash III等人主编,2007年亚利桑那州立大学出版。内容为该地区地衣植物区系的相关记录,以XML格式存储,支持地衣多样性、分类及分布研究,共包含1个文件。 文件详解 文件名称:237.xml 文件格式:XML...
-
IN01056_Sanskrit_XML_拉维瓦尔曼授予金德拉的哈尔西特许状石刻数据
数据集概述 本数据集包含编号IN01056的哈尔西特许状(共3块石刻)的梵语文本XML文件,记录拉维瓦尔曼对金德拉的授予内容。数据无元数据,仅含1个XML文件,用于古文献数字化研究与梵语铭文分析。 文件详解 核心文件 文件名称:IN01056.xml 文件格式:XML...
-
IN01017_Amgura_Charter_Jayaraja梵语XML文献数据
数据集概述 本数据集包含IN01017号Jayaraja的Amgura宪章的梵语XML文件,未包含元数据。数据集仅含一个文件,无目录层级划分,无训练/测试、数据/标签或原始/处理数据的拆分,文件类型单一为XML格式。 文件详解 文件名称:IN01017.xml 文件格式:XML...
-
IN01031_梵语铭文数据_注_此翻译仅针对专有名词和术语_文本内容保持英文原样
数据集概述 本数据集为IN01031号文献,即Ravivarman第34年Davanagere授予令的梵语XML文件,无附加元数据。数据集仅包含一个XML文件,用于存储该历史铭文的梵语文本内容,支持历史文献数字化研究与文本分析。 文件详解 文件名称:IN01031.xml 文件格式:XML...
-
Gemein_Nachrichten_Based_弟兄会1807年第30期手稿转录数据
数据集概述 本数据集为弟兄会(Unitas Fratrum / Moravian Church)最古老的通讯刊物《Gemein-Nachrichten》1807年第30期的数字化转录资料,包含XML-TEI格式的多版本转录文件及标准化文本文件,记录了弟兄会的社区报告、宣教工作内容、讲道及人物生平,是研究弟兄会历史及宗教文化的重要文献资源。 文件详解...
-
RRV_Temperature_Based温度影响Ross_River病毒传播模型数据
数据集概述 本数据集包含Ross River病毒传播的温度响应机制模型相关数据,涵盖模型代码、输入输出数据及文献数字化数据。数据通过非线性模型揭示温度对病毒传播的非线性影响,明确传播峰值温度及热限,可用于分析气候变暖对不同区域传播的影响。 文件详解 代码文件(.r格式,10个)...
-
Scarlet_Gown_Encoded_Robert_Murray诗歌TEI编码数据
数据集概述 本数据集是Robert Fuller Murray所著《The Scarlet Gown》第二版中诗歌《The City of Golf》的Xml-TEI格式有效编码数据,由帕多瓦大学2022年春季Digital Philology课程制作,关联DissGea、MoHu Center、MobiLab机构。 文件详解...
-
Handschrift_Serrure_Based_中世纪荷兰语杂集手稿原始XML数据
数据集概述 本数据集包含中世纪荷兰语杂集Handschrift-Serrure(编号Hs. Brussel, KBR, II 144)外交版本(diplomatic edition)所基于的原始XML数据。该版本遵循Peter Boot和Herman...
-
Noscemus_Transkribus_Based_早期现代拉丁印刷品机器可读文本数据
数据集概述 本数据集包含从Noscemus Wiki收录的作品数字副本中提取的纯文本,通过Transkribus工具转换为机器可读格式。文本通过Transkribus ID相互关联,每个数字副本的来源均有记录。转录文本由NOSCEMUS项目训练的早期现代拉丁印刷品识别模型自动生成,未经过人工编辑或校正,共包含1个文件。 文件详解...
-
IN00617_Based_Chalukya王朝Nagavardhana授予文书XML数据
数据集概述 本数据集包含Chalukya王朝Nagavardhana授予文书的XML格式数字化文件,是一份记录古代印度Chalukya王朝授予行为的历史文献资料,总计包含1个文件。 文件详解 文件名称:IN00617 TEI.xml 文件格式:XML...
-
IN00619_Translation_DAHRSENA_PARDI_PLATES翻译文档
数据集概述 本数据集为IN00619号文献《DAHRSENA的PARDI PLATES》的翻译文档,核心内容是对该古代文献的文本翻译,为研究相关历史、文化或语言提供基础资料。数据集仅包含一份翻译文件。 文件详解 文件名称:IN00619 translation.docx 文件格式:DOCX 字段映射介绍:文档为《DAHRSENA的PARDI...
-
IN01021_Source_桑戈利Harivarman_8年特许状梵语XML数据_原始文本
数据集概述 本数据集包含IN01021号桑戈利地区Harivarman统治8年的特许状梵语文本,以XML格式存储,无附加元数据。数据集仅含1个文件,无目录层级,未划分训练/测试、数据/标签或原始/处理版本,是研究古代印度特许状文献的基础文本资源。 文件详解 文件名称:IN01021.xml 文件格式:XML...
-
Quebec_Arrivals_Database_1817_1839_魁北克船只抵达记录数据集
数据集概述 本数据集记录了1817-1839年抵达魁北克市的17,783条船只信息,数据源自《魁北克公报》(The Quebec gazette/La gazette de Québec)及Ships List网站,补充转录5年数据后经清洗、标准化处理,可用于19世纪魁北克移民与航运历史研究。 文件详解 文件名称:Quebec Arrivals...
-
UBL000049211_基于荷兰乌得勒支省及城市1728年前法令集的转录数据_纠缠的历史项目
数据集概述 本数据集为荷兰乌得勒支省及城市法令集的转录数据,源自1729年出版的《Groot placaatboek》第二卷,收录了乌得勒支省议会及乌得勒支市市长与市议会至1728年的所有法令、条例和敕令。数据由乌得勒支大学图书馆藏本转录而来,是研究荷兰乌得勒支地区早期法律与行政历史的重要文献资料。 文件详解 文件名称:UBL000049211.zip...
-
BDRC_Relations_Based_民国人物传记词典原始NLP关系数据_20190815
数据集概述 本数据集是基于CoreNLP从《民国人物传记词典》(BDRC)中提取的人物关系原始NLP输出数据,未经任何处理与清洗,包含1个文件,为研究民国人物关系网络提供基础数据支撑。 文件详解 文件名称:BDRC_Relations_Raw_20190815.xlsx 文件格式:XLSX...
-
Siddham_Based_IN02080_Yengu_Bahaltole梵语碑文XML草稿数据
数据集概述 本数据集包含IN02080 Yengu Bahaltole碑铭的梵语XML文件,为Epidoc格式草稿版本,无元数据,计划纳入"Siddham"档案。数据集仅含一个文件,可用于碑铭文献数字化研究与梵语碑文文本分析。 文件详解 文件名称:IN02080.xml 文件格式:XML...



