-
南非语言嵌入评估数据集_Simlex_和_WordSim
2026年1月30日 30 132 59
数据集概述 本数据集包含针对南非语言(塞茨瓦纳语、塞佩迪语)的Simlex和WordSim评估数据,通过人工标注的单词对相似度评分,用于衡量语义相关性。单词对由英文手动翻译而来,可用于计算模型向量余弦相似度与人类评分的相关性,评估语言模型性能。数据集共含4个文件。 文件详解 文件名称:SimLex-999-orig - Sepedi.xlsx...
-
DD_Based_发展性阅读障碍跨语言脑结构功能异常研究数据
2026年1月29日 30 158 66
数据集概述 本数据集围绕发展性阅读障碍(DD)的脑结构与功能异常展开,通过多模态元分析探究不同语言间脑异常的一致性与差异性,发现跨语言的左侧颞上回异常及语言特异性脑区差异,为DD病因提供跨语言视角的神经机制见解。 文件详解 README_file.docx 文件格式:DOCX...
-
Typology_of_concord_Based_跨语言一致性类型学原始数据_2020
2026年1月13日 30 164 97
数据集概述 本数据集为跨语言一致性类型学研究的原始数据,由Sterre Leufkens在冗余性研究框架下采集。包含数据表、代码本和元数据三类文件,记录跨语言一致性的实证情况与功能,可用于语言学领域的跨语言分析与理论验证。 文件详解 yoda-metadata.xml 文件格式:XML 字段映射介绍:元数据文件,记录数据集的描述性信息...



