-
葡萄牙语文本中的性别偏见数据集
2025年12月22日 30 150 131
数据集概述 该数据集包含用于研究葡萄牙语文本中性别偏见的相关数据,包括精选的葡萄牙语文学语料库、构建句子模板的词表以及已生成的句子模板文件,为基于掩码语言模型的性别偏见分析提供支持。 文件详解 语料库文件: corpus.zip:压缩文件,包含1804-1998年巴西和欧洲葡萄牙语的592部散文作品,共120万句、1760万词的精选文学语料库...
-
KPAAMCAM_IDP_Lower_Fungom_Biya_Based_500名词词表完整数据
2025年12月21日 30 134 67
数据集概述 该数据集是一份包含500个名词的Biya Mungbam语言词表,Biya Mungbam是喀麦隆西北部Menchum区Lower Fungom地区使用的语言。词表基于两名男女发音人的数据,记录了声调、前缀、词根及名词短语等方面的个体差异。 文件详解 文件名称:KPAAMCAM-IDP_NTs_BIYA 500 NOUNS...
-
MTrill项目句法启动实验数据集
2025年12月15日 30 77 18
数据集概述 该数据集包含三十名巴西葡萄牙语使用者参与句法启动实验的匿名数据。实验分为基线阶段和启动阶段,记录了参与者在翻译任务及图片描述任务中使用的句子结构(介词短语或名词短语)、启动效应、累积指标及英语水平测试成绩等信息。 文件详解 该数据集由多个文件组成,具体说明如下: - 核心数据文件: -...
-
俄语多词表达式分布语义模型数据集
2025年12月9日 30 153 57
数据集概述 本数据集包含俄语多词表达式,依据名词短语与其中心词意义间是否存在“范畴转换”筛选。含173个存在转换的正向样本和173个无转换的负向样本,标注用于进一步分类,为分布语义模型(DSM)词汇构建提供数据支持。 文件详解 文档文件(PDF格式,共3个): Dataset_part1.pdf:第一部分数据集文档...
-
比喻性名词短语数据集BNFigurativeNPDataset-ghazalismydaughter
2025年4月26日 30 19 13
比喻性名词短语数据集BNFigurativeNPDataset-ghazalismydaughter 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,比喻性语言,名词短语,语义分析,文本挖掘,机器学习 数据概述: 该数据集包含来自语言学研究和自然语言处理领域的比喻性名词短语数据,记录了各类比喻性表达和其语义特征。主要特征如下:...



