图表类型识别数据集

图表类型识别数据集_Chart_Type_Recognition_Dataset

数据来源:互联网公开数据

标签:图表识别, 图像分类, 机器学习, 数据集, 计算机视觉, 图表分析, 可视化, 深度学习

数据概述: 该数据集包含来自图表图像的数据,记录了图表的文件名、来源和图表类型信息,用于训练图表类型识别模型。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态图像数据集。 地理范围:数据来源未明确限定,但图表类型具有通用性。 数据维度:包括“img_file_name”(图像文件名)、“source”(图表来源,如“generated”或“extracted”)和“chart_type”(图表类型,如“vertical_bar”、“line”、“scatter”等)等字段。另包含一个记录损坏文件名的csv文件。 数据格式:主要为.csv、.pth、.yaml和.pkl格式,其中name_source_df.csv提供了图像文件与图表类型之间的对应关系,.pth文件可能包含训练好的模型权重,.yaml文件可能包含模型超参数配置信息,.pkl文件可能包含模型训练过程中的中间结果。 来源信息:数据来源于Benetech Making Graphs Accessible项目,旨在促进图表的可访问性。该数据集已进行预处理,用于图表类型识别任务。 该数据集适合用于图表类型识别和图像分类的研究,以及深度学习模型的训练与评估。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于计算机视觉、模式识别等领域的研究,如图表图像的自动分类、图表结构分析等。 行业应用:可以为数据可视化、商业智能、金融分析等行业提供数据支持,特别是在自动化图表生成、图表信息提取等领域。 决策支持:支持决策者快速理解图表信息,提升决策效率。 教育和培训:作为计算机视觉、机器学习课程的教学素材,帮助学生理解图像分类、目标检测等技术。 此数据集特别适合用于探索不同类型图表的视觉特征,训练识别模型,实现图表类型的自动分类和分析,从而提高信息获取效率。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 482.34 MiB
最后更新 2025年8月12日
创建于 2025年8月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。