找到3个数据集

分类: 公开数据 标签: LREC2020

过滤结果
  • 用于流行病学事件提取的多语言数据集_LREC_2020

    2026年1月30日 30 132 19

    数据集概述 本数据集是LREC 2020论文《A Dataset for Multi-lingual Epidemiological Event Extraction》配套数据,包含多语言流行病学事件抽取语料,支持自然语言处理领域相关研究,以压缩包形式提供,仅含一个文件。 文件详解...
    packageimg
  • 数据73种语言句子级释义语料库TaPaCo

    2025年12月22日 30 71 50

    数据集概述 该数据集为73种语言的句子级释义语料库TaPaCo,从Tatoeba数据库提取,经语言无关过滤和修剪步骤处理。含约190万句,每种语言20万至25万句,覆盖无其他释义数据集的语言,部分语言人工评估显示半数至四分之三释义正确。 文件详解 文件名称: tapaco_v1.0.zip:压缩包格式,包含73种语言的句子级释义语料库数据 文件名称:...
    packageimg
  • 英法同源词时间分析数据集2020

    2025年12月4日 30 191 94

    数据集概述 该数据集为LREC 2020会议论文配套数据,核心内容围绕英法同源词的时间分析展开,包含论文文档及同源词列表文本文件,为相关语言研究提供数据支持。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: Frossard_etal_2020_dataset-English-French-cognates_LREC.pdf -...
    packageimg