找到1个数据集

标签: 词汇表构建

过滤结果
  • 中文文本分词训练数据集

    2025年10月24日 30 108 95

    中文文本分词训练数据集_Chinese_Text_Tokenization_Training_Dataset 数据来源:互联网公开数据 标签:中文分词, 文本处理, 自然语言处理, 机器学习, 词汇表构建, BPE分词, 语料库, 深度学习 数据概述: 该数据集包含用于中文文本分词任务的训练数据和相关配置信息。主要特征如下:...
    packageimg