找到494个数据集

标签: 信息抽取

过滤结果
  • 美国国会议员网站议题列表数据集

    2025年11月27日   

    数据集概述 该数据集针对美国第115届国会,记录了每位议员在其官方网站议题优先级页面中重点关注的议题内容,为分析国会议员的政策关注倾向提供基础数据。 文件详解 文件名称: Issues Listed on U.S. Politicians Websites/Website Coding Origional copy.sav 文件格式:...
    packageimg
  • 巴西组织中女性性骚扰受害者后果与反应访谈转录数据集

    2025年11月27日   

    数据集概述 该数据集包含发表于BAR - Brazilian Administration Review的研究论文配套访谈转录文件,聚焦巴西组织中女性性骚扰受害者的后果与反应,共收录44份PDF格式的访谈记录,为相关研究提供质性数据支持。 文件详解 文件名称:44份PDF格式访谈转录文件,示例包括S14442J02 - Entrevista AS 6...
    packageimg
  • 银行XYZ信息技术部门负责人访谈数据集

    2025年11月27日   

    数据集概述 本数据集包含针对银行XYZ信息技术部门负责人的访谈数据,以文档形式记录访谈内容,为了解该银行IT部门管理实践、技术战略等提供一手资料。 文件详解 文件名称:Interview Data.docx 文件格式:DOCX(Microsoft Word文档) 数据结构:包含访谈原始记录或整理内容,已完成数据与标签的划分(具体划分规则未提供预览)...
    packageimg
  • 独立发布的自由格式文章数据集2024

    2025年11月27日   

    数据集概述 本数据集包含一篇2024年独立发布的自由格式文章,由Marcell D. Williams创作,未提供具体内容预览,整体以无扩展名的文件形式存储。 文件详解 文件名称:Dex.docx/EQ2o3nCabAVIkPxbsXtO8r4Bt44iFREf20lv9L7Gz0BrvA[1] 文件格式:无扩展名(no_ext)...
    packageimg
  • 可再生能源真伪信息社交媒体分类数据集

    2025年11月27日   

    数据集概述 本数据集包含三百条关于可再生能源的社交媒体信息,其中一百五十条为有效信息,一百五十条为虚假信息。数据按媒体类型分类,涵盖图片、视频、文本等形式,每条信息标注创作者名称、来源国家及语言(印尼语或英语)。 文件详解 文件名称: dataset 300 information renewable energy valid and...
    packageimg
  • PMC临床试验解缠表格数据集2014

    2025年11月27日   

    数据集概述 该数据集基于PubMed Central 2014年公开样本中6558篇临床试验文章构建,通过匹配PMC与Medline文档并筛选含“Clinical”类型的文献,经TableDisentangler工具处理、UMLS/MetaMap标注,包含患者年龄、性别分布、FEV1指标(仅COPD研究)等提取结果。 文件详解...
    packageimg
  • 饮食与运动对子宫内膜异位症影响的文献分析数据集

    2025年11月27日   

    数据集概述 本数据集是关于饮食与运动对子宫内膜异位症影响的文献分析资料,包含文献检索策略、研究筛选流程图及数据提取表三类文件,为系统性文献回顾提供方法与数据记录支持。 文件详解 文件名称:Documento 1. Estrategia de búsqueda en BD.pdf 文件格式:PDF 内容:记录在不同数据库中实施的文献检索策略...
    packageimg
  • 香港爆水管基础设施故障依赖与利益相关者识别附录数据集

    2025年11月26日   

    数据集概述 本数据集为通过新闻挖掘识别基础设施故障依赖关系及相关利益相关者的研究附录文件,以香港爆水管事件为案例,包含新闻收集与清洗、领域知识组件、信息提取验证及故障规则结果等相关数据。 文件详解 文件名称:Appendix I_News collected & cleansed.xlsx,文件格式:.xlsx,内容:收集并清洗后的新闻数据...
    packageimg
  • 计算工作流文本描述信息类型分析数据集2009

    2025年11月26日   

    数据集概述 该数据集是2009年围绕计算工作流文本描述信息类型分析的研究资料,基于手动标注方法构建,包含分析流程、实验笔记、词汇表及结果文件等,为理解科研人员如何用自然语言描述计算工作流提供数据支持,是相关会议论文的基础数据。 文件详解 分析文件:...
    packageimg
  • 文本观点实体识别训练数据集

    2025年11月26日   

    文本观点实体识别训练数据集_Text_Opinion_Entity_Recognition_Training_Dataset 数据来源:互联网公开数据 标签:实体识别, 文本分析, 观点挖掘, 自然语言处理, 机器学习, 数据标注, 命名实体识别, 情感分析 数据概述:...
    packageimg
  • 直升机呼号数据及航班信息分析数据集

    2025年11月25日   

    直升机呼号数据及航班信息分析数据集_Helicopter_Callsigns_and_Flight_Information_Analysis_Dataset 数据来源:互联网公开数据 标签:直升机, 呼号, 航班数据, 航空, 数据分析, 飞行器, 交通运输, 机器学习 数据概述:...
    packageimg
  • 教育研究论文数据集_双重入学与学位获得关系分析

    2025年11月22日   

    教育研究论文数据集_双重入学与学位获得关系分析_Educational_Research_Paper_Dataset__Dual_Enrollment_and_Degree_Attainment_Analysis 数据来源:互联网公开数据 标签:教育研究, 学位获得, 双重入学, 自然语言处理, 文本分析, 机器学习, 教育政策, 语料库 数据概述:...
    packageimg
  • 新冠疫情医学论文摘要数据集

    2025年11月21日   

    新冠疫情医学论文摘要数据集_COVID_19_Medical_Paper_Abstract_Dataset 数据来源:互联网公开数据 标签:新冠疫情, 医学论文, 摘要分析, 文本挖掘, 生物医学, 自然语言处理, 疫情研究, 文本分类 数据概述:...
    packageimg
  • 医学文本信息抽取标注数据集

    2025年11月17日   

    医学文本信息抽取标注数据集_Medical_Text_Information_Extraction_Annotation_Dataset 数据来源:互联网公开数据 标签:医学文本,信息抽取,命名实体识别,标注数据,自然语言处理,机器学习,医疗健康,文本分析 数据概述:...
    packageimg
  • 金融领域问答与文本摘要数据集

    2025年10月16日   

    金融领域问答与文本摘要数据集_Financial_Question_Answering_and_Text_Summarization 数据来源:互联网公开数据 标签:金融, 问答系统, 文本摘要, 知识检索, 信息抽取, 机器学习, 自然语言处理, 文本分析 数据概述:...
    packageimg
  • 医学论文结构元素识别预测数据集

    2025年10月16日   

    医学论文结构元素识别预测数据集_Medical_Paper_Structure_Element_Recognition_Prediction 数据来源:互联网公开数据 标签:医学论文, 文本标注, 结构识别, 自然语言处理, 机器学习, 文本分类, 实体识别, 预测模型 数据概述:...
    packageimg
  • 医学文本信息抽取验证数据集

    2025年10月10日   

    医学文本信息抽取验证数据集_Medical_Text_Information_Extraction_Validation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 文本标注, 机器学习, 自然语言处理, 医疗健康 数据概述:...
    packageimg
  • 越南新闻文章内容分词与处理数据集

    2025年10月5日   

    越南新闻文章内容分词与处理数据集_Vietnamese_News_Articles_Content_Segmentation_and_Processing 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 越南语, 分词, 新闻文章, 文本摘要, 信息抽取, 语言模型 数据概述:...
    packageimg
  • 文本信息实体识别标注数据集

    2025年9月17日   

    文本信息实体识别标注数据集_Text_Information_Entity_Recognition_Annotation_Dataset 数据来源:互联网公开数据 标签:实体识别, 命名实体识别, 信息抽取, 文本标注, 机器学习, 自然语言处理, 数据集, 序列标注 数据概述:...
    packageimg
  • 医学文本信息抽取评估数据集

    2025年7月22日   

    医学文本信息抽取评估数据集_Medical_Text_Information_Extraction_Evaluation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 评估数据集, 深度学习, 自然语言处理, 文本标注 数据概述:...
    packageimg