找到2个数据集

标签: 汉语拼音

过滤结果
  • Crow_Based_1931年中国报纸目录原始与清洗数据

    2026年1月29日 30 198 129

    数据集概述 本数据集包含从Carl Crow 1931年版《中国报纸目录》中提取的两份文件,分别为原始提取数据和经过校正、清洗与标准化的版本。每份文件的每一行对应一个独特的报刊标题,记录了报刊名称(含英文、威妥玛拼音、中文、汉语拼音)、出版地(城市、省份)、创刊年份、发行量、出版商名称及简介、页数与尺寸、栏数与尺寸等信息。 文件详解 原始数据文件...
    packageimg
  • 汉字与汉语拼音转换训练数据集

    2025年4月15日 30 150 115

    汉字与汉语拼音转换训练数据集 数据来源:互联网公开数据 标签:汉字,汉语拼音,文本数据,语言处理,机器学习,自然语言处理,数据转换 数据概述: 本数据集包含了多领域文本数据,包括汉字语句序列及其对应的汉语拼音序列。这些数据适用于训练汉字与汉语拼音之间的互转模型,支持多种自然语言处理任务。 数据用途概述: 该数据集适用于汉字-...
    packageimg