-
Supplementary_data_manuscript_学术文献补充数据
数据集概述 本数据集为某学术手稿的补充数据,包含一份文档文件,用于支撑手稿的研究内容。数据集结构简单,未划分训练测试、数据标签或原始处理数据,文件类型单一。 文件详解 文件名称:Magnaetal_supplementary.docx 文件格式:DOCX 字段映射介绍:未提供内容预览,推测为支撑学术手稿的补充文本、表格、图表或数据说明等相关信息。...
-
Kanuri_Interior_Robinson_Crusoe_语言研究文档
数据集概述 本数据集包含一份关于Kanuri语言的文档,核心内容涉及Kanuri语言与《鲁滨孙漂流记》相关的研究材料。文档以docx格式呈现,无其他关联文件或目录结构,可用于Kanuri语言相关的学术研究或资料参考。 文件详解 文件名称:521_kanuri_interior_robinson_crusoe.docx 文件格式:DOCX...
-
Shared_Research_Repository_BL报纸样本纯文本数据集
数据集概述 本数据集包含Shared Research Repository发布的报纸文章纯文本数据,以压缩包形式提供,可用于自然语言处理相关的文本分析任务,总计包含一个文件。 文件详解 压缩文件 文件名称:newspaper_text.zip 文件格式:ZIP...
-
IN02002_Sanskrit_昌古纳拉扬石柱北轴铭文梵语XML数据_草稿版
数据集概述 本数据集包含IN02002昌古纳拉扬石柱北轴铭文的梵语文本,以XML格式存储,为Epidoc标准的草稿版本,不含元数据,计划纳入"Siddham"档案。数据集仅包含1个文件,无目录结构,未划分训练/测试、数据/标签或原始/处理集。 文件详解 文件名称:IN02002.xml 文件格式:XML...
-
Food_Fraud_Vulnerability_中国欧洲食品供应链欺诈评估数据
数据集概述 本数据集包含中国和欧洲多家企业的香料/生姜及葡萄酒食品欺诈脆弱性评估结果,属于食品真实性创新实施任务(WP3 Task 3.2)的一部分,旨在帮助理解选定食品链中的欺诈脆弱性,为食品真实性领域工作提供数据支持。 文件详解 生姜评估文件 文件名称:Data_Spices_Task 3.2_Food fraud vulnerability...
-
IN02023_EpiDoc_Balambu卢库_马哈迪奥石碑梵语XML草稿数据
数据集概述 本数据集为IN02023 Balambu卢库·马哈迪奥石碑的梵语XML文件,采用EpiDoc格式草稿版,无元数据,计划纳入“Siddham”档案。包含1个XML文件,记录该石碑的梵语文本内容,用于碑铭文献的数字化整理与研究。 文件详解 文件名称:IN02023.xml 文件格式:XML...
-
IN02029_EpiDoc_Bhimasena_Temple梵语铭文草案XML数据
数据集概述 本数据集包含编号为IN02029的Bhimasena Temple铭文的梵语XML文件,为EpiDoc格式的草案版本,将纳入"Siddham"档案。文件未包含元数据,仅涉及铭文内容的数字化记录,是研究该古铭文的基础数据资源。 文件详解 文件名称:IN02029.xml 文件格式:XML...
-
IN01016_Source_Sudevaraja的Nahna宪章梵语XML文献数据
数据集概述 本数据集包含IN01016号Sudevaraja的Nahna宪章梵语文献,以XML格式存储,无附加元数据。数据集仅含一个文件,无目录层级结构,未划分训练/测试集、数据/标签集或原始/处理集,文件类型单一为XML格式。 文件详解 文件名称:IN01016.xml 文件格式:XML...
-
IN02026_EpiDoc_Siddham档案Hari_Hara基座铭文梵语XML草稿数据
数据集概述 本数据集为IN02026 Hari-Hara基座铭文的梵语XML文件,是EpiDoc格式的草稿版本,计划纳入“Siddham”档案。数据不含元数据,仅包含一份XML文件,记录该铭文的文本内容,适用于梵语铭文的数字化研究与文献整理。 文件详解 文件名称:IN02026.xml 文件格式:XML...
-
IN02021_Based_Lagantole_Avalokitesvara梵语XML草稿版
数据集概述 本数据集为IN02021 Lagantole Avalokitesvara底本的梵语XML文件,属于未包含元数据的Epidoc格式草稿版,拟纳入"Siddham"档案。数据集仅含1个XML文件,无目录层级,无训练/测试、数据/标签、原始/处理数据拆分,聚焦于梵语文本的数字化呈现。 文件详解 文件名称:IN02021.xml 文件格式:XML...
-
IN01017_Amgura_Charter_Jayaraja梵语XML文献数据
数据集概述 本数据集包含IN01017号Jayaraja的Amgura宪章的梵语XML文件,未包含元数据。数据集仅含一个文件,无目录层级划分,无训练/测试、数据/标签或原始/处理数据的拆分,文件类型单一为XML格式。 文件详解 文件名称:IN01017.xml 文件格式:XML...
-
IN02094_Sanskrit_Epidoc格式Kumbhesvara铭文草稿数据
数据集概述 本数据集为IN02094 Kumbhesvara铭文的梵语XML文件,采用Epidoc格式草稿版,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个文件,用于记录和保存该古铭文的数字化文本内容。 文件详解 文件名称:IN02094.xml 文件格式:XML...
-
IN02076_Siddham归档_Patan_Gairidhara碑铭梵语XML数据
数据集概述 本数据集为Patan地区Gairidhara碑铭(编号IN02076)的梵语文本XML文件,是Epidoc格式的草稿版本,计划纳入"Siddham"档案库。数据无元数据,仅包含碑铭文本内容,共1个文件。 文件详解 文件名称:IN02076.xml 文件格式:XML...
-
IN02019_Based_Pasupati_Sivalinga底座梵语XML草案数据
数据集概述 本数据集为IN02019号文物(Abhiri的Pasupati Sivalinga底座)的梵语文本XML文件,采用Epidoc格式草案版本,无元数据,计划纳入"Siddham"档案。数据核心为该梵语铭文的数字化文本,支持考古与梵语文献研究。 文件详解 文件名称:IN02019.xml 文件格式:XML...
-
IN01055_Halsi_Grant_of_Ravivarman_梵语铭文XML数据
数据集概述 本数据集为IN01055编号的《拉维瓦尔曼的哈尔西授予文书》(含5块碑板)的梵语文本XML文件,未包含元数据。数据集仅含一个文件,无目录层级划分,文件类型单一为XML格式,无训练测试、数据标签或原始/处理数据的拆分。 文件详解 文件名称:IN01055.xml 文件格式:XML...
-
Webis_Editorial_Quality_新闻社论双视角质量评估标注数据集2018
数据集概述 本数据集为Webis-Editorial-Quality-18语料库,包含1000篇新闻社论的质量评估数据。每篇社论由3名自由派和3名保守派标注者分别进行质量评分,并附带标注者针对观察效果的自由文本理由,旨在支持新闻社论质量新维度的研究。 文件详解 文件名称:corpus-webis-editorial-quality-18.zip...
-
bibelexegese_Based_Vat_gr_752诗篇插图标题数据集_Beta版
数据集概述 本数据集为Beta版本,包含梵蒂冈希腊文手稿752号(Vat. gr. 752)中诗篇1至151篇插图的标题信息,旨在为圣经研究提供相关文献资源。数据集仅含一个压缩文件,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 压缩文件 文件名称:bibelexegese/crostini_appendix-v0.5.zip...
-
IN02043_Draft_Epidoc_Amsuvarma桑加铭文梵语XML数据_待归档
数据集概述 本数据集为IN02043编号的Amsuvarma桑加铭文梵语文本,以XML格式存储的Epidoc标准草稿版本,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个文件,用于铭文文献的数字化与存档。 文件详解 文件名称:IN02043.xml 文件格式:XML...
-
创新知识_基于伊西多尔_塞维利亚作品的词源研究_早期中世纪拉丁手稿数据集_v2_3_4版本
数据集概述 本数据集为Excel格式的结构化数据表,记录了现存且已识别的所有中世纪早期西方拉丁手稿中包含塞维利亚的伊西多尔《词源》全文或部分文本的信息。涵盖手稿的起源地、出处、保存状况、创作年代、物质属性、文字、内容、显著特征、在线呈现及参考文献等维度,共收录五百零七份手稿(不同版本数量略有差异),时间跨度为公元七世纪至十一世纪上半叶。 文件详解...
-
IN01050_Based_Santivarman_Talagunda碑铭梵语XML文本数据
数据集概述 本数据集包含Santivarman的Talagunda碑铭(编号IN01050)的梵语文本XML文件,无附加元数据。数据核心为该碑铭的数字化文本内容,支持碑铭文献的数字化研究与文本分析,仅包含一个XML文件。 文件详解 文件名称:IN01050.xml 文件格式:XML...



