数据19世纪奥地利报纸OCR训练数据集_NewsEye_READ

该数据集包含19世纪至20世纪初奥地利报纸页面的经人工校正文本数据，分为训练集（148页）和验证集（13页），采用PAGE格式存储，由Transkribus平台生成，支持NewsEye与READ项目研究。

训练集文件: TrainingSet_ONB_Newseye_GT_M1+.zip，ZIP格式压缩包，包含148页奥地利报纸页面的OCR标注训练数据，采用PAGE XML格式存储。
验证集文件: ValidationSet_ONB_Newseye_GT_M1+.zip，ZIP格式压缩包，包含13页奥地利报纸页面的OCR标注验证数据，采用PAGE XML格式存储。

奥地利国家图书馆

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	174.1 MiB
最后更新	2025年12月4日
创建于	2025年12月4日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。