找到1个数据集

格式: ZIP 标签: DivergentDiscourses

过滤结果
  • Tibetan_SpaCy_Based_藏语语言模型工具包_ver1_0_0_1

    2026年1月15日 30 127 109

    数据集概述 本数据集为适用于SpaCy环境的藏语语言模型工具包,由James Engels开发,属于伦敦大学亚非学院与莱比锡大学联合项目Divergent Discourses。模型使用Botok分词器处理藏语,替换音节分隔符为空格,包含停用词列表,当前版本对标准词汇处理效果良好,正开发更复杂版本,共含3个文件。 文件详解...
    packageimg