找到1,784个数据集

标签: 语言学分析

过滤结果
  • El_Deber_报纸2017年6月至2022年6月观点文章与社论数据集

    2025年11月29日   

    数据集概述 本数据集包含2017年6月至2022年6月期间《El Deber》报纸的六十一篇观点文章与社论,旨在支持关于玻利维亚圣克鲁斯地区Puerto Busch河项目(位于潘塔纳尔和巴拉圭河玻利维亚岸)的研究,聚焦圣克鲁斯商业利益相关者对该项目的话语表达。 文件详解 该数据集由数据文件和文档文件组成,具体说明如下: - 数据文件: -...
    packageimg
  • 孟加拉地区语音数据集_RBVD

    2025年11月29日   

    数据集概述 本数据集通过面对面录音采集了孟加拉国八个地区的语音样本,包含不同地区的孟加拉语发音变体。每个地区对应一个文件夹,朗布尔地区分男女两个子文件夹,共1067个样本,支持孟加拉语方言多样性研究与语音技术开发。 文件详解 核心压缩文件: RBVD Regional Bangla Voice Dataset.zip(ZIP格式) 内部结构:...
    packageimg
  • 葡萄牙语作者归属分析语料库

    2025年11月29日   

    数据集概述 该数据集是用于作者归属分析的葡萄牙语语料库,包含三位不同作者的作品,每位作者各三部,共计九部书籍文本,为研究文本特征与作者风格关联提供数据支持。 文件详解 文件类型:所有文件均为TXT格式(.txt),共9个文件,占比百分之百 文件示例: MC_O Outro Pe da Sereia.txt MC_Jesusalem.txt JS_A...
    packageimg
  • 帕哈里语词性标注语料库数据集

    2025年11月29日   

    数据集概述 该数据集包含帕哈里语(巴基斯坦和印度部分地区使用的低资源印欧语系语言)的人工标注词性(POS)语料库,涵盖名词、动词等主要语法类别,采用基于乌尔都语标签集调整的自定义标签系统,提供词性标注及文本处理相关文件。 文件详解 文本数据文件(共6个.txt格式文件): 包括Pahari Dataset/File 9 COMPLETE CLEANED...
    packageimg
  • 汉语Callhome与Callfriend语料库非完成体结构标注数据集

    2025年11月29日   

    数据集概述 本数据集是对汉语Callhome和Callfriend口语语料库中的非完成体结构进行标注的数据集,包含标注后的口语对话文本及相关语言学特征信息,为研究汉语口语中非完成体的使用规律提供数据支持。 文件详解 文件名称:Imperfectives in Chinese Callhome and Chinese...
    packageimg
  • 足球实时文本解说中的隐喻数据集2025

    2025年11月29日   

    数据集概述 该数据集包含2025年欧洲冠军联赛、欧会杯及欧联杯的实时文本解说内容,基于认知隐喻理论分析解说中的概念隐喻,数据源于体育实时资讯平台提供的赛事解说文档。 文件详解 赛事解说文档: 2025 UEFA Champions League Final.docx: DOCX格式文档,包含2025年欧洲冠军联赛决赛的实时文本解说内容 2025...
    packageimg
  • 乌兹别克语形态分析数据集_含英文翻译

    2025年11月29日   

    数据集概述 该数据集包含三千余个乌兹别克语词形,每个词形均标注有词根、词缀及词性信息,并配有英文翻译。数据以Excel表格形式存储,列结构清晰,便于分析与建模,为乌兹别克语形态学研究提供基础数据支持。 文件详解 文件名称: Dict (+Eng translation).xlsx 文件格式: Excel (.xlsx) 字段映射: 第一列:词形序号...
    packageimg
  • 视听语音与清晰语音对跨语言感知同化影响数据集

    2025年11月29日   

    数据集概述 该数据集为“视听语音与清晰语音对跨语言感知同化的影响”研究的补充材料,包含向参与者呈现的视听刺激样本,具体为信德语内爆卷舌塞音/ᶑ/的清晰语音和引用语音录音,由来自巴基斯坦拉丹的三十五岁女性信德语母语者录制。 文件详解 文件名称:...
    packageimg
  • 西班牙与拉美西班牙语规范存在性探讨文献2015

    2025年11月28日   

    数据集概述 该数据集包含一篇探讨西班牙与拉美地区西班牙语规范存在性的文献,分析不同地区西班牙语的特征,探讨制定统一西语美洲规范的可能性。 文件详解 文件名称: 2015 Algunos apuntes sobre la existencia o ausencia de la norm.PDF 文件格式: PDF 内容概述:...
    packageimg
  • 阿尔茨海默病早晚期叙事言语语言特征数据集

    2025年11月28日   

    数据集概述 本数据集包含阿尔茨海默病早晚期患者叙事言语语言特征研究的全部统计数据,涉及句子类型、中位数检验、图形及统计分析等相关文件,为分析该疾病不同阶段语言表现提供数据支持。 文件详解 句子类型分析文档:Sentence types.docx,格式为docx,内容涉及叙事言语中的句子类型相关分析。 中位数检验文档:Median...
    packageimg
  • 第一语言与第二语言句法启动语义独立性研究数据集

    2025年11月28日   

    数据集概述 该数据集围绕句法启动实验展开,探究第一语言(L1)和第二语言(L2)中,介词短语(PP)语义角色是否影响PP附着句法结构的解析。实验通过相同语义角色(within-role)和不同语义角色(cross-role)的句子列表,分析句法启动效应的差异。 文件详解 文件名称: Data.xlsx 文件格式: Excel (.xlsx) 文件内容:...
    packageimg
  • 孟加拉语新闻分类数据集_BARD语料库

    2025年11月28日   

    数据集概述 该数据集包含从孟加拉国主流新闻平台收集的2500篇孟加拉语新闻文章,分为经济、娱乐、国际、体育、国内五个平衡类别,每类500篇,支持孟加拉语文本分类、自然语言处理及相关机器学习任务。 文件详解 文件名称:Bangla_Data_Artical_Dataset.zip 文件格式:ZIP压缩包...
    packageimg
  • 母语与非母语者比喻短语理解对比研究数据

    2025年11月28日   

    数据集概述 本数据集包含用于研究母语与非母语者对比喻短语(包括习语和隐喻)理解差异的实验材料。数据摘自Carrol、Littlemore和Dowens的研究报告,核心内容为实验使用的短语及其含义,同时包含研究中使用的三个替代含义选项。数据集旨在为语言认知研究提供标准化的实验刺激材料。 文件详解 文件名称: Carrol-Littlemore-...
    packageimg
  • 乌克兰语言意识中_побратим_概念的联想结构数据集

    2025年11月28日   

    数据集概述 本数据集聚焦乌克兰语言意识中"побратим"概念的联想结构,分析其语义特征、范式与组合关系,探讨该概念作为文化符号在俄乌战争背景下对民族团结、兄弟情谊及社会凝聚的标识作用。 文件详解 文件名称: Questionnaires in Google Forms.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 古英语尾韵合规性数据集

    2025年11月28日   

    数据集概述 该数据集聚焦古英语尾韵合规性,收集了原始日耳曼语词汇在古英语中的演变案例,通过对比古高地德语、古诺斯语词汇,分析尾韵辅音簇的修复过程,共包含五十八个数据样本。 文件详解 文件名称: c8g575ztpb-1/Coda Well-formedness in Old English.docx 文件格式: DOCX (.docx) 文件内容:...
    packageimg
  • 约旦阿拉伯语Facebook用户表情符号交际功能数据集

    2025年11月28日   

    数据集概述 该数据集围绕约旦阿拉伯语Facebook用户使用的表情符号交际功能展开,包含眨眼表情、笑哭表情、红心表情、飞吻表情、微笑表情五种表情符号的语用功能相关数据,为研究表情符号在阿拉伯语社交语境中的使用提供支持。 文件详解 眨眼表情语用功能数据文件: 文件名称:Data related to the pragmatic functions of...
    packageimg
  • 学术英语_商务与医学_评价性That从句模式的AI与语料库研究数据集

    2025年11月28日   

    数据集概述 本数据集基于AI和语料库方法,研究商务与医学领域学术英语中评价性That从句模式。聚焦评价性语言在学术写作中的应用,揭示其在构建学术论证、传达作者立场方面的作用,为学术英语语言学研究提供支持。 文件详解 文件名称: 2that sent.xlsx 文件格式: Excel (.xlsx) 内容说明:...
    packageimg
  • 土耳其民谣形式改编的尤努斯_埃姆雷诗歌韵律分析数据集

    2025年11月28日   

    数据集概述 该数据集为一篇关于土耳其民谣形式改编的尤努斯·埃姆雷诗歌韵律分析的文章而创建,包含9张JPG格式的图片文件,未提供具体内容预览,整体结构单一,无训练测试、数据标签或原始处理数据的划分。 文件详解 该数据集包含一个目录下的9个文件,具体说明如下: - 目录: Türk Halk Müziği Türkü Formunda Bestelenen...
    packageimg
  • 英语与汉语中_I_动词_信念结构的韵律语用映射数据集

    2025年11月28日   

    数据集概述 该数据集包含英语与汉语中[I+动词]信念结构的韵律语用映射相关原始数据,用于开展感知测试研究,为分析两种语言中该结构的韵律特征与语用功能关联提供基础数据。 文件详解 文件名称: RawData.sav 文件格式: SPSS数据格式(.sav) 内容说明:...
    packageimg
  • 韩语指代形式与助词选择参考数据

    2025年11月28日   

    数据集概述 本数据集为韩语指代形式与助词选择的参考数据,提供相关语言现象的研究基础数据支持。 文件详解 文件名称: Hwang_data_for_reference_form_particle_choice_in_Korean.xlsx 文件格式: XLSX(Excel表格) 内容说明:...
    packageimg