eBL_Based_楔形文字符号OCR识别结果数据

数据集概述

本数据集是电子巴比伦图书馆团队通过OCR模型对eBL平台约七万五千张楔形文字泥板照片进行识别的结果。尽管设置了高阈值以提升准确率,仍提取出约一百二十二万四千一百零九个符号。数据集包含一个JSON文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据。

文件详解

  • 文件名称:eBL_OCRed_Signs.json
  • 文件格式:JSON
  • 字段映射介绍:未提供具体字段信息,推测包含楔形文字泥板照片的OCR识别结果,可能涵盖符号文本、位置坐标、置信度等与识别相关的结构化数据。

数据来源

Electronic Babylonian Library Team(https://github.com/ElectronicBabylonianLiterature/cuneiform-ocr

适用场景

  • 楔形文字数字化研究:用于分析OCR技术在古代楔形文字识别中的应用效果与准确率。
  • 古代文献数字化整理:辅助eBL平台楔形文字泥板照片的文本提取与结构化处理。
  • 文字识别技术优化:基于识别结果改进楔形文字OCR模型的算法与阈值设置。
  • 古代文明研究:为楔形文字相关的历史、语言研究提供数字化文本数据支持。
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。