数据集

古代手稿图像易读性主观评估数据集

数据集概述

该数据集为古代手稿图像易读性的主观评估数据，包含50个手稿区域的250张图像，以及基于20位文献学和古文字学专家研究得出的平均易读性空间图和不确定性空间图，为数字文本修复领域定量评估指标开发提供基准。

文件详解

该数据集包含一个压缩文件，解压后包含以下目录和文件： - 核心数据目录 (images/): - input/: 包含用于评估的测试图像文件 - mean_score_maps/: 包含平均易读性的空间映射文件 - std_maps/: 包含易读性不确定性（标准差）的空间映射文件 - 处理与元数据目录 (src/): - images.json: 定义数据集中包含的源图像信息 - users.json: 参与评估的专家列表及其属性 - assessments.json: 实验生成的主要评估数据 - salami_proc.py: 用于处理上述json文件的Python函数脚本 - salami_proc_usage.py: 调用salami_proc.py函数以复现论文中的输出图像和统计结果 - salami_llm.R: 记录使用R语言进行的线性混合模型分析过程

适用场景

数字文本修复研究: 用于开发和验证古代手稿图像易读性的定量评估算法
古文字学分析: 辅助研究古代手稿的书写特征与易读性关联
人机交互评估: 比较机器自动评估与专家主观评估的一致性
历史文献数字化: 为古籍数字化项目中的文本可读性优化提供数据支持

数据与资源

4270352.zipZIP
82.69 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	82.69 MiB
最后更新	2025年12月8日
创建于	2025年12月8日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。