-
古典藏语标注语料库第二部分_词性标注版
2025年12月22日 30 166 133
数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集构建的古典藏语词性标注语料库第二部分,使用TiMBL的基于记忆的标注器(Memory-Based Tagger)完成标注,未经过后处理或人工校正。 文件详解 压缩文件集(共12个,均为.zip格式):...
-
古典藏文标注语料库第一部分_基于BDRC数字化文本的分词版本
2025年12月14日 30 101 79
数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集的古典藏文分词版本语料库,采用TiMBL的基于记忆的标注器进行词性标注,未经过后处理或人工校正,包含12个压缩文件。 文件详解 该数据集包含12个压缩文件,具体说明如下: -...
-
古典藏文标注语料库2020_Version2_带分词与词性标注
2025年12月7日 30 11 1
数据集概述 该数据集为古典藏文标注语料库(ACTib)第二版,包含超一亿八千五百万个词元,基于XML文件构建,提供分词与词性标注的压缩文件,采用自动后处理方法,未涉及人工校正。 文件详解 数据集包含11个压缩文件,具体说明如下: - 压缩文件组(共11个.zip格式文件): - SegPOS-...



