找到2个数据集

分类: 公开数据 标签: SpaCy

过滤结果
  • Tibetan_SpaCy_Based_藏语语言模型工具包_ver1_0_0_1

    2026年1月15日 30 13 9

    数据集概述 本数据集为适用于SpaCy环境的藏语语言模型工具包,由James Engels开发,属于伦敦大学亚非学院与莱比锡大学联合项目Divergent Discourses。模型使用Botok分词器处理藏语,替换音节分隔符为空格,包含停用词列表,当前版本对标准词汇处理效果良好,正开发更复杂版本,共含3个文件。 文件详解...
    packageimg
  • Social_Work_Scopus_Based_2016_2024研究SDGs及世界区域关系数据

    2026年1月6日 30 202 72

    数据集概述 本数据集包含2016至2024年Scopus收录的社会工作相关研究文献,通过特定检索条件筛选获取。数据补充了每项研究与可持续发展目标(SDGs)的关联关系(由Aurora-SDG分类器模型生成)及与世界区域的关联关系(由SpaCy NER库分析生成)。数据集仅包含一个文件。 文件详解...
    packageimg