美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集

美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集 数据来源:互联网公开数据 标签:FDA,Form483,检查报告,文本提取,关键信息,聚类分析,AWS Textract,数据挖掘,医疗器械,药品 数据概述: 本数据集旨在为研究美国食品药品监督管理局(FDA)483表格的检查结果提供数据支持。数据来源于使用AWS Textract从FDA 483表格中提取的文本和表格信息。由于AWS Textract在识别页面方向时对关键信息提取的准确性有重要影响,因此本数据集重点关注对关键信息进行聚类的分析。数据集中,每个关键值对(Key-Value)都整合到一个更大的边界框中,边界框包含了原始坐标。置信度(Confidence)值也来自AWS Textract的分析结果。

数据用途概述: 该数据集适用于分析FDA 483表格中的检查结果,并进行关键信息的聚类分析。研究人员可以使用该数据评估AWS Textract在提取表格数据时的性能,探索如何通过聚类技术更好地组织和理解检查结果。此外,该数据集也可用于开发和测试自动化检查报告分析工具,帮助改进对FDA检查结果的理解,从而提高合规性和风险管理水平。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。