-
VR_Swedish_Based历史语义变化词汇列表数据
2026年1月30日 30 71 62
数据集概述 本数据集为VR资助项目“Towards Computational Lexical Semantic Change Detection”(2018-01184)收集的瑞典词汇历史语义变化列表,包含过去几个世纪中发生语义变化的瑞典词汇信息,当前为暂停状态下的未完成版本,旨在促进合作与研究使用。 文件详解 文件名称:A list of...
-
IN01059_Sanskrit_XML_梵语历史授权文书数据
2026年1月28日 30 190 174
数据集概述 本数据集包含IN01059号文献《Mrgesavarman 4年Devagiri授权文书》的梵语XML文件,无元数据。文件总数1个,无目录层级,未划分训练/测试、数据/标签或原始/处理集,主要文件类型为XML,占比百分之百。 文件详解 文件名称:IN01059.xml 文件格式:XML 字段映射介绍:包含《Mrgesavarman...
-
IN02033_EpiDoc_布达尼尔坎塔石刻铭文梵语XML数据
2026年1月28日 30 11 6
数据集概述 本数据集为IN02033布达尼尔坎塔石刻铭文的梵语XML文件,属于EpiDoc格式的草稿版本,将纳入"Siddham"档案。数据未包含元数据,仅提供铭文的文本内容数字化记录,是研究该古铭文的基础文本资料。 文件详解 文件名称:IN02033.xml 文件格式:XML...
-
Álgu_Based_Ume_Saami词汇数据现代化拼写转换数据
2026年1月27日 30 159 4
数据集概述 本数据集包含源自Schlachter 1958版Ume Saami词典的多版处理数据,从Álgu数据库获取并与原始词典核对词头变体,将词头机械转换为近似现代Ume Saami正字法(参考Barruk 2018)。提供字母化列表及反向字母化文件,含3个文件,支持词汇研究与语言保护。 文件详解 压缩文件(ume-MalaLpW-mod.zip)...
-
IN02060_凯瓦尔普尔碑文_梵语_XML_草稿_Epidoc版本
2026年1月27日 30 31 17
数据集概述 本数据集包含IN02060 Kevalpur铭文的梵语XML文件,为Epidoc格式的草稿版本,计划纳入"Siddham"档案。数据聚焦于该铭文的数字化文本内容,未包含元数据,仅提供一份核心文件用于铭文研究与文本分析。 文件详解 文件名称:IN02060.xml 文件格式:XML...
-
Vocabulary_Workshop_2021词汇工具目录参考数据
2026年1月26日 30 130 74
数据集概述 本数据集为2021年词汇研讨会生成的词汇工具目录草案副本,在2022年词汇研讨会中被提及。目录由多位参与者合作创建,旨在汇总词汇工具信息,帮助用户解决词汇工具选择问题,包含一份Excel格式文件。 文件详解 文件名称:Catalogue of Vocabulary tools from 2021 workshop - referred to...
-
Zhivlov_Ob_Ugrian_Swadesh词表注释数据2011
2026年1月22日 30 199 119
数据集概述 本数据集基于Zhivlov于2011年发布的《Ob-Ugrian语族(乌拉尔语系)注释Swadesh词表》,由The Global Lexicostatistical Database提供。数据以压缩包形式存储,包含Ob-Ugrian语族的Swadesh词表注释内容,是研究该语族词汇特征的基础资料。 文件详解...
-
IN02045_Sanskrit_Epidoc梵语石刻铭文草稿XML数据
2026年1月21日 30 10 8
数据集概述 本数据集为阿姆苏瓦尔马(Amsuvarma)的布格马蒂(Bungmati)石刻铭文(编号IN02045)的梵语文本数字化数据,采用Epidoc格式的XML文件存储(无元数据),是拟纳入"Siddham"档案的草稿版本,用于印度古代碑铭文献的数字化保存与研究。 文件详解 文件名称:IN02045.xml 文件格式:XML...
-
Mondzish_Based_中国采集词汇录音转录数据库_2012_2015
2026年1月20日 30 56 30
数据集概述 本数据集为Mondzish(Mangish)词汇数据库,包含2012-2015年在中国采集的音频录音转录内容,是单一文件的词汇资源,可用于Mondzish语言的词汇研究与分析。 文件详解 文件名称:Mondzish_lexical_database.xlsx 文件格式:XLSX...
-
IN01012_Sanskrit_XML格式Jayaraja_Arang宪章文本数据
2026年1月18日 30 14 1
数据集概述 本数据集包含IN01012编号对应的Jayaraja Arang宪章的梵语文本,以XML格式存储,无元数据。数据集仅含一个文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理数据,是研究古代梵语历史文献的基础文本资源。 文件详解 文件名称:IN01012.xml 文件格式:XML...
-
IN01050_Based_Santivarman_Talagunda碑铭梵语XML文本数据
2026年1月12日 30 18 14
数据集概述 本数据集包含Santivarman的Talagunda碑铭(编号IN01050)的梵语文本XML文件,无附加元数据。数据核心为该碑铭的数字化文本内容,支持碑铭文献的数字化研究与文本分析,仅包含一个XML文件。 文件详解 文件名称:IN01050.xml 文件格式:XML...
-
基于语料库的行为特征分析_古希腊形容词_mikrós_和_mégas_语义关系研究_补充材料
2026年1月12日 30 146 111
数据集概述 本数据集为论文“A corpus-based behavioral profile analysis of polysemy and antonymy: The case of the ancient Greek size adjectives mikrós and...
-
IN01042_Sanskrit_XML格式Ravivarman的Nilambur授权文件数据
2026年1月12日 30 173 19
数据集概述 本数据集为IN01042编号的《Ravivarman的Nilambur授权文件》梵语文本的XML格式文件,无元数据信息。数据集仅包含1个XML文件,未进行训练/测试、数据/标签或原始/处理等划分,专注于提供该历史授权文件的数字化文本内容。 文件详解 XML数据文件 文件名称:IN01042.xml 文件格式:XML...
-
IN02003_Sanskrit_Based_昌古纳拉扬石柱西轴铭文梵语XML数据_draft
2026年1月11日 30 103 27
数据集概述 本数据集包含IN02003昌古纳拉扬石柱西轴铭文的梵语文本数据,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份核心XML文件,用于铭文文本的数字化保存与研究。 文件详解 文件名称:IN02003.xml 文件格式:XML...
-
IN01001_Based_Bhavattavarman的Rithapur宪章梵语XML文本数据
2026年1月7日 30 103 93
数据集概述 本数据集包含IN01001编号的《Bhavattavarman的Rithapur宪章》梵语文本数据,以XML格式存储,无元数据。数据集仅含一个文件,文件结构扁平化,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:IN01001.xml 文件格式:XML...
-
Spanish_text_corpus_Based_Wikipedia_自然语言处理语言学研究数据
2026年1月7日 30 35 1
数据集概述 本数据集是从Wikipedia提取的西班牙语文本语料库,适用于自然语言处理(NLP)和语言学研究。提取过程采用特定平台,相关方法在文献中有所记载。数据集包含原始提取结果和经清洗过滤后的句子数据,共2个文件。 文件详解 文件名称:rawdata.dat.zip 文件格式:ZIP(压缩包)...
-
IN01003_Sanskrit_Based_Kesaribeda_Arthapati捐赠梵语文献XML数据
2025年12月29日 30 73 0
数据集概述 本数据集为IN01003编号对应的Kesaribeda地区Arthapati捐赠相关的梵语文献,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级划分,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:IN01003.xml 文件格式:XML 字段映射介绍:包含Kesaribeda Donation of...
-
英语和乌兹别克语中表达_嘴_概念的工具性名词场研究
2025年12月21日 30 165 1
数据集概述 该数据集包含一篇关于英语和乌兹别克语中表达“嘴”概念的工具性名词场的研究文档,聚焦两种语言中相关概念的词汇表达体系,为对比语言学研究提供资料支持。 文件详解 文件名称: Botirbek Otajonov.pdf 文件格式: PDF (.pdf) 文件内容:...
-
基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017
2025年12月21日 30 190 88
数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
-
哥廷根印度语言电子文本登记帕里西塔数据集
2025年12月19日 30 88 5
数据集概述 该数据集是哥廷根印度语言电子文本登记(GRETIL)的帕里西塔(PARIŚIṢTA)部分,包含3个HTML格式的印度语言电子文本文件,无目录结构,文件类型单一。 文件详解 核心文本文件(共3个,均为.htm格式): dantyovu.htm:HTML格式的印度语言电子文本文件 avpari_u.htm:HTML格式的印度语言电子文本文件...



