俄语多词表达式分布语义模型数据集

数据集概述

本数据集包含俄语多词表达式,依据名词短语与其中心词意义间是否存在“范畴转换”筛选。含173个存在转换的正向样本和173个无转换的负向样本,标注用于进一步分类,为分布语义模型(DSM)词汇构建提供数据支持。

文件详解

  • 文档文件(PDF格式,共3个):
  • Dataset_part1.pdf:第一部分数据集文档
  • Dataset_part2.pdf:第二部分数据集文档
  • Пояснительная записка.pdf:说明性文档
  • 数据文件(CSV格式,共2个):
  • Dataset_part1.csv:第一部分数据文件,包含字段如“Словосочетание”(多词表达式)、“Значение (кратко)”(简要含义)、“PMI”、“Синтаксическая категория”(句法类别)等
  • Dataset_part2.csv:第二部分数据文件,包含字段如“Словосочетание”(多词表达式)、“PMI”、“Синтаксический тип”(句法类型)等

适用场景

  • 计算语言学研究:用于俄语多词表达式的句法与语义分析
  • 自然语言处理模型训练:支持分布语义模型(DSM)的词汇资源构建
  • 俄语语义学研究:分析多词表达式的范畴转换规律与标注分类
  • 语言资源开发:为俄语多词表达式语料库扩充提供标注数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.31 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。