找到3个数据集

标签: 语言使用特征

过滤结果
  • 达罗毗荼语混合文本情感分析与冒犯性语言识别数据集2020

    2025年12月21日 30 50 27

    数据集概述 该数据集为三种低资源达罗毗荼语(泰米尔语、卡纳达语、马拉雅拉姆语)与英语的混合社交媒体评论数据,包含六万余条YouTube评论,经人工标注用于情感分析和冒犯性语言识别,标注者间一致性较高,支持相关自然语言处理研究。 文件详解 文件名称: DravidianCodeMix-2020.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 冰岛语社会语言学田野调查数据集2019

    2025年12月9日 30 67 38

    数据集概述 本数据集是2019年科隆大学“科隆城市田野调查”语言学学士研讨会的冰岛语研究成果,包含社会语言学问卷、斯瓦迪士词汇表录音及数字二和五的结构化诱发实验数据,支持冰岛语社会语言学特征分析。 文件详解 文档类文件(PDF格式):...
    packageimg
  • 世界语言景观中的国家层面语言学研究对象

    2025年12月6日 30 195 95

    数据集概述 本数据集聚焦于“世界语言景观中的国家层面”这一语言学研究对象,通过单一PDF文档呈现相关研究内容,为语言学领域关于语言景观的国家维度分析提供资料支持。 文件详解 文件名称: Akramova Guljakhon.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg