来自可兰经的阿拉伯语手写数据集AHDQ

来自可兰经的阿拉伯语手写数据集AHDQ 数据来源:互联网公开数据
标签:阿拉伯语手写,可兰经,OCR,文化传承,机器学习,计算机视觉,自然语言处理

数据概述:
本数据集是一个专为OCR任务设计的全面阿拉伯语手写数据集,涵盖了来自塞内加尔沃洛夫社区的手写可兰经手稿的丰富传统。数据集包含642个二值化图像,每个图像包含多行手写可兰经经文,并附有对应的标注文本文件。这些图像展示了六种不同的沃洛夫手写风格,为研究阿拉伯语手写识别、语言学分析和文化 heritage 的数字化保护提供了宝贵的资源。

数据用途概述:
该数据集适用于多种应用场景,包括但不限于:
1. 训练阿拉伯语手写OCR模型,特别是针对可兰经文本的识别任务。
2. 分析和比较不同沃洛夫阿拉伯语手写风格的特点。
3. 开展与手写宗教文本相关的语言学和文化研究。
4. 阿拉伯语文本识别任务,支持模型的微调和优化。

此外,数据集未来计划扩展,增加更多来自沃洛夫及其他社区的手写可兰经文本,进一步丰富手写风格的多样性,为更广泛的阿拉伯语手写识别研究提供支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 104.62 MiB
最后更新 2025年4月19日
创建于 2025年4月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。