-
Jordanian_Arabic_Adjectives_情感规范数据
数据集概述 本数据集包含98个约旦阿拉伯语形容词在效价(Valence)、唤醒度(Arousal)和熟悉度(Familiarity)三个维度的规范数据,为阿拉伯语情感计算和语言学研究提供结构化参考。数据集仅包含一个文档文件。 文件详解 文件名称:Datafinal.docx 文件格式:DOCX...
-
ACORNS_Based_Caregiver数据集HAC特征及元数据
数据集概述 本数据集包含ACORNS Caregiver数据集的共现特征直方图,以及对应的元数据文件。数据来源于ACORNS项目,其中.mat文件为特征数据,部分文件通过Python代码提取并带有"_python"后缀;.json文件为数据集元数据。数据集总计30个文件,主要用于多模态特征分析。 文件详解 .mat文件(共28个)...
-
Variations_Based_斯洛伐克语附着词位置变异研究数据集
数据集概述 本数据集为论文“Variations on positioning of clitics in Slovak (on the basis of corpus and experimental data)”配套数据,核心内容围绕斯洛伐克语中附着词的位置变异展开,基于语料库和实验数据构建,包含一个文件,用于支撑相关语言学研究分析。 文件详解...
-
Invisible_East_Based_中世纪阿富汗及周边多语言文献JSON数据集
数据集概述 本数据集为Invisible East Digital Corpus的JSON格式版本,包含公元4/10世纪至7/13世纪中世纪阿富汗及周边地区的多语言文献,涵盖新波斯语、中古波斯语、阿拉伯语等语言,提供高清图像、转录及翻译内容,适用于计算分析与数字保存。 文件详解 文件名称:iedc_2025-08-07_18-07.json...
-
Kara_Nonopai_Frog_Story_多格式口头传统记录数据
数据集概述 本数据集包含Kara Nonopai语言使用者Lilian Maturau讲述的青蛙故事相关记录,涵盖原始与编辑版本的多格式文件,共5个文件,用于保存和展示该语言的口头叙事内容。 文件详解 文件名称:Kara_Nonopai_Frog Story.MOV 文件格式:MOV 字段映射介绍:青蛙故事的视频记录文件...
-
WoPoss_Source_拉丁语模态演变研究语料库标注样本_2022
数据集概述 本数据集是WoPoss团队标注的WoPoss语料库样本,包含五部拉丁语经典文本:M. Minucius Felix的《Octavius》、P. Ovidius Naso的《Metamorphoses》(第一卷)、G. Petronius Arbiter的《Satyricon》、Q. S. F. Tertullianus的《De...
-
Alpha_Bantu_Tone_1_班图语声调研究文献数据库_第一版
数据集概述 本数据集是班图语声调研究的文献数据清单,为班图语声调研究提供主要描述性资料来源,是该数据库Alpha版本的第一版。数据集包含一个压缩文件,可用于班图语声调语言学研究的文献检索与参考。 文件详解 文件名称:AlphaBantuDatabase-1.zip 文件格式:ZIP...
-
DravLex_Based_达罗毗荼语词汇数据库首版数据_v1_0_0
数据集概述 本数据集为DravLex达罗毗荼语词汇数据库的首次发布版本,包含一个压缩文件,整体目录结构简洁,未划分训练/测试集、数据/标签集或原始/处理数据,无自述文件或内容预览,核心为达罗毗荼语词汇相关数据。 文件详解 压缩文件 文件名称:Verkerk/DravLex-v1.0.0.zip 文件格式:ZIP...
-
Phlorest_Based_Pama_Nyungan语言系统发育树数据
数据集概述 本数据集是基于Bouckaert等人2018年发表的《澳大利亚Pama-Nyungan语言的起源与扩张》研究生成的Phlorest系统发育树数据,用于记录和分析澳大利亚Pama-Nyungan语言的演化关系,为语言学研究提供结构化的系统发育参考。 文件详解 文件名称:phlorest/bouckaert_et_al2018-v1.1.zip...
-
CLDF_Based_Gran_Chaco区域语言比较词表数据集2022
数据集概述 本数据集为CLDF格式,对应Brid等人2022年发布的《Gran Chaco区域语言比较词表》,包含该区域语言的比较词表信息,是研究Gran Chaco地区语言特征的结构化数据资源,共含一个文件。 文件详解 压缩包文件 文件名称:lexibank/chacolanguages-v0.3.zip 文件格式:ZIP...
-
隐喻性别单口喜剧_波兰单口喜剧中性别隐喻研究素材列表_2018_2022
数据集概述 本数据集是“单口喜剧中性别隐喻概念化”项目的素材列表,包含2018-2022年发布的波兰单口喜剧节目信息,用于后续隐喻识别研究。数据记录了节目链接、发布日期、时长、百万次观看量等内容,覆盖17部男性喜剧演员作品和13部女性喜剧演员作品,总计1个文件。 文件详解 文件名称:Comedians.xlsx 文件格式:XLSX...
-
Lee_Hasegawa_Based_Ainu语言时空演化CLDF数据集
数据集概述 本数据集是基于Lee和Hasegawa 2013年发表的《Ainu Language in Space and Time》研究生成的CLDF格式数据集,包含与阿伊努语言时空演化相关的语言数据,以压缩文件形式存储,是研究阿伊努语言演化的结构化参考资料。 文件详解 文件名称:lexibank/leeainu-v1.2.zip 文件格式:ZIP...
-
Sino_Tibetan_Based_汉藏语系降雨表达类型学研究辅助数据
数据集概述 本数据集为汉藏语系降雨表达类型学研究的补充数据,核心内容围绕汉藏语系语言中降雨相关表达的类型学特征展开,支持对该语言现象的系统性分析。数据集包含1个文件,整体结构简单,无目录层级划分。 文件详解 文件名称:Rain in ST supplementary data.xlsx 文件格式:XLSX...
-
IN01015_Sanskrit_Dhamatari特许状文本XML数据
数据集概述 本数据集为Sudevaraja的Dhamatari特许状的梵语文本数字化文件,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一为XML。 文件详解 文件名称:IN01015.xml 文件格式:XML...
-
IN02045_Sanskrit_Epidoc梵语石刻铭文草稿XML数据
数据集概述 本数据集为阿姆苏瓦尔马(Amsuvarma)的布格马蒂(Bungmati)石刻铭文(编号IN02045)的梵语文本数字化数据,采用Epidoc格式的XML文件存储(无元数据),是拟纳入"Siddham"档案的草稿版本,用于印度古代碑铭文献的数字化保存与研究。 文件详解 文件名称:IN02045.xml 文件格式:XML...
-
Multi_CAST_Arta_Based多语言口语标注文本数据集2311
数据集概述 本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。 文件详解...
-
Sims_Based_Proto_Rma声调历时研究CLDF数据集2020
数据集概述 本数据集是基于Sims 2020年发表的《Reconsidering the diachrony of tone in Rma》一文生成的CLDF格式数据集,核心内容为Proto-Rma声调历时演变的相关语言数据,为语言学研究提供结构化的声调演变分析基础。 文件详解 文件名称:lexibank/simsrma-v1.3.zip...
-
La_Repubblica_Based_意大利共和报2011年文章摘录数据
数据集概述 本数据集包含意大利报纸《La Repubblica》2011年的文章摘录,对搜索关键词(dialett、Italian、lingu*)进行了高亮标注,仅用于科学研究。数据集文件总数为1,无目录结构,主要文件格式为DOCX。 文件详解 文件名称:Zenodo_Data.docx 文件格式:DOCX 字段映射介绍:包含意大利报纸《La...
-
PHQ_9_SAN_MARTÍN_Based克丘亚语版本心理健康评估量表数据
数据集概述 本数据集包含圣马丁克丘亚语版本的PHQ-9量表工具,是心理健康评估领域的本地化量表资源,支持使用克丘亚语开展抑郁症状筛查工作,数据集仅包含一份文档文件。 文件详解 文件名称:ANEXO 1 PHQ_9SAN MARTIN.docx 文件格式:DOCX...
-
Obligatory_Past_Tense_Context_语法语境标注数据
数据集概述 本数据集聚焦于自然语言处理领域的过去时强制语境研究,包含一个Excel文件,主要内容为与过去时语法语境相关的文本数据,可用于语法分析、语境识别等NLP任务,为研究语言中的时态强制现象提供基础数据支持。 文件详解 文件名称:Past Tense Obligatory Context.xlsx 文件格式:XLSX...



