找到7个数据集

标签: 语料库研究

过滤结果
  • 金融新闻文本挖掘平行语料库数据集2007_2020

    2025年12月15日 30 49 23

    数据集概述 本数据集为金融领域的英汉平行新闻语料库,包含2007至2020年的60,473篇双语文档,涵盖新闻的标题、正文等核心内容,可用于金融领域的平行双语文本挖掘研究。 文件详解 文件名称:FT-en-zh.rar 文件格式:RAR压缩包...
    packageimg
  • 英文公证语篇中情态动词使用研究数据集

    2025年12月13日 30 160 31

    数据集概述 本数据集围绕英文公证语篇中的情态动词使用展开研究,包含一份相关的PDF文档,为分析公证语篇中情态动词的功能、分布及语用特征提供资料支持。 文件详解 文件名称: Ezozkhon Ortikova.pdf 文件格式: PDF (.pdf) 内容:...
    packageimg
  • 巴西葡萄牙语中含度量单位的强化结构数据集

    2025年12月12日 30 94 25

    数据集概述 本数据集包含巴西葡萄牙语中“动词+度量单位”强化结构的真实语料,如“correr quilômetros(跑数公里)”“chorar rios(哭成河)”,数据来源于数字媒体文本,未对原始版本进行修改,同时包含动词分类、主语生命性等分析维度。 文件详解 文件名称: intensificadores unidades de medida -...
    packageimg
  • Open_Linguistics待发表文章补充材料与原始数据

    2025年12月5日 30 48 38

    数据集概述 本数据集包含发表于《Open Linguistics》的论文《COVID-19的语言影响:四种语言的语料库研究》的补充材料(A、B、C)及原始数据,涵盖病毒名称及相关词汇的多语言原始数据,为研究提供支撑。 文件详解 补充材料文件: Supplement A.pdf、Covid discourse Supplement...
    packageimg
  • JAAH音频对齐爵士和声数据集

    2025年12月4日 30 19 7

    数据集概述 该数据集包含113首爵士曲目标注,选自《史密森尼经典爵士合集》和《爵士:史密森尼选集》,覆盖不同表演者、子流派及历史时期。标注由爵士音乐家完成,涵盖全曲的节拍、结构及和弦信息。 文件详解 文件名称: MTG/JAAH-v0.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 宾夕法尼亚德语词表_词形还原与词性标注

    2025年12月4日 30 105 32

    数据集概述 该数据集包含ENDE语料库中宾夕法尼亚德语部分的词表,涵盖1761个词元及其对应的2704个词形,已完成词形还原和词性标注,为宾夕法尼亚德语的语言分析提供基础数据。 文件详解 词表数据文件: 文件名称:ENDE-corpus POS-annotated PDC lexicon.tsv 文件格式:TSV(.tsv)...
    packageimg
  • GPT_4生成传记中的性别偏见研究补充材料_意大利语与法语人名语料库

    2025年12月4日 30 16 1

    数据集概述 本数据集是关于GPT-4生成传记中性别偏见的语料库研究补充材料,聚焦意大利语和法语人名的分析。数据集包含一份PDF格式的补充文档,为理解模型生成内容中的性别偏见现象提供支持。 文件详解 文件名称: Decesare_Weidensdorfer_Burchardt_2025_supplementary material_LaGenda.pdf...
    packageimg