MERMaid多模态反应挖掘提示与原始数据集

数据集概述

该数据集是MERMaid项目的配套数据,包含多模态反应挖掘任务中使用的提示词文件及Dataraider、KGWizard模块的原始响应文件,覆盖PDF处理相关的多模态数据挖掘内容。

文件详解

该数据集包含8个文件,具体说明如下: - prompts.zip:ZIP格式压缩文件,可能包含多模态反应挖掘任务中使用的提示词集合 - MERMaid100_DOI_list.json:JSON格式文件,可能包含MERMaid项目涉及的100篇文献的DOI列表 - dataraider_additional_raw_responses.zip:ZIP格式压缩文件,包含Dataraider模块的额外原始响应数据 - visualheist_evaluation_set_DOI_list.json:JSON格式文件,可能包含VisualHeist评估集涉及的文献DOI列表 - extracted_rxn_dictionaries.zip:ZIP格式压缩文件,可能包含提取的反应字典数据 - graph_files.zip:ZIP格式压缩文件,可能包含多模态反应挖掘相关的图形文件 - visualheist_segmentationcheck_logs.zip:ZIP格式压缩文件,包含VisualHeist分割检查的日志数据 - dataraider_output_Gaussianblurlevels.zip:ZIP格式压缩文件,包含Dataraider模块不同高斯模糊水平下的输出数据

适用场景

  • 多模态数据挖掘研究:用于探索PDF文档中多模态反应信息的自动提取方法
  • 自然语言处理应用:分析提示词设计对多模态任务响应结果的影响
  • 计算机视觉研究:结合分割日志数据,研究医学CT图像等视觉内容的处理技术
  • 数据处理方法优化:基于原始响应文件,优化多模态数据挖掘模块的输出效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.74 MiB
最后更新 2025年12月24日
创建于 2025年12月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。