找到2个数据集

标签: PDF提取

过滤结果
  • 巴西旅游学期刊引用数据1990_2018

    2025年12月14日 30 96 59

    数据集概述 该数据集包含1990至2018年间巴西16种旅游学期刊发表的3887篇文章及其引用数据,记录了10882条被引信息。所有数据通过手动从PDF文件中提取并完成审核,为研究巴西旅游学术成果的影响力提供支持。 文件详解 文件名称: CitacoesRecebidas.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 火星目标百科全书_月球与行星科学会议标注摘要数据集2015_2016

    2025年12月11日 30 199 193

    数据集概述 本数据集包含2015年和2016年月球与行星科学会议(LPSC)发表的117篇摘要的标注文本数据,通过Apache Tika工具提取PDF文本,并以brat标注工具格式提供实体与关系注释,支持文本挖掘与信息提取研究。 文件详解 压缩文件:lpsc-annotated.zip(ZIP格式),包含以下目录和文件:...
    packageimg