找到2个数据集

分类: 公开数据 标签: Shechen

过滤结果
  • 古典藏语标注语料库第二部分_词性标注版

    2025年12月22日 30 173 124

    数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集构建的古典藏语词性标注语料库第二部分,使用TiMBL的基于记忆的标注器(Memory-Based Tagger)完成标注,未经过后处理或人工校正。 文件详解 压缩文件集(共12个,均为.zip格式):...
    packageimg
  • 古典藏文标注语料库2020_Version2_带分词与词性标注

    2025年12月7日 30 112 11

    数据集概述 该数据集为古典藏文标注语料库(ACTib)第二版,包含超一亿八千五百万个词元,基于XML文件构建,提供分词与词性标注的压缩文件,采用自动后处理方法,未涉及人工校正。 文件详解 数据集包含11个压缩文件,具体说明如下: - 压缩文件组(共11个.zip格式文件): - SegPOS-...
    packageimg