Dzongkha_Handwritten_Digit_Dataset_NLP任务数据集

数据集概述

本数据集为宗喀语手写数字图像数据,包含1000张JPG格式图像,涵盖0至9共10类宗喀语数字字符,由不丹100名不同背景人员手写采集,旨在填补宗喀语手写字符识别基准数据集的空白,支持自然语言处理相关研究。

文件详解

  • 文件名称:Dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含1000张宗喀语手写数字图像,图像对应10类数字标签(0-9,字符形式为༠至༩),无明确的文件内字段划分,图像内容为手写数字样本。

适用场景

  • 宗喀语手写字符识别模型训练: 用于构建和优化宗喀语数字手写体识别算法。
  • 低资源语言NLP研究: 支持不丹宗喀语等低资源语言的自然语言处理任务探索。
  • 多语言手写识别系统开发: 作为多语言手写识别系统中宗喀语数字模块的数据源。
  • 文化语言技术保护: 为宗喀语数字化保存与技术应用提供基础数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 69.72 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。