找到202个数据集

标签: 信息提取

过滤结果
  • 自然语言处理基础数据集NLPDataset1-kryusufkaya

    2025年4月26日   

    自然语言处理基础数据集NLPDataset1-kryusufkaya 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,文本分类,情感分析,信息提取 数据概述: 该数据集包含来自互联网的公开文本数据,记录了多种自然语言处理任务的基础文本信息。主要特征如下: 时间跨度:数据记录的时间范围未明确标注,涵盖多个时间段。...
    packageimg
  • 自然语言处理在灾难推文分析数据集NLPDisasterTweetsDataset-shailjakanttiwari

    2025年4月26日   

    自然语言处理在灾难推文分析数据集NLPDisasterTweetsDataset-shailjakanttiwari 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,文本分析,机器学习,社交媒体,灾害管理,情感分析,信息提取 数据概述:...
    packageimg
  • 灾害事件分类与信息提取数据集DisasterEventsClassificationandInformationExtractionDataset-pra...

    2025年4月26日   

    灾害事件分类与信息提取数据集DisasterEventsClassificationandInformationExtractionDataset-praveersinhparmar 数据来源:互联网公开数据 标签:灾害管理,文本分类,数据集,自然语言处理,机器学习,信息提取,应急响应,大数据 数据概述:...
    packageimg
  • 网页内容数据集WebpageContentDataset-shreshthvashisht

    2025年4月26日   

    网页内容数据集WebpageContentDataset-shreshthvashisht 数据来源:互联网公开数据 标签:网页内容,数据集,网络分析,数据挖掘,自然语言处理,信息提取,互联网研究,大数据 数据概述: 该数据集包含来自互联网的网页内容数据,记录了各类网页的文本内容,链接结构及元数据。主要特征如下:...
    packageimg
  • CNN新闻文章数据集CNNNewsArticlesDataset-rockystats

    2025年4月26日   

    CNN新闻文章数据集CNNNewsArticlesDataset-rockystats 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,媒体研究,数据挖掘 数据概述: 该数据集包含来自美国有线电视新闻网(CNN)的新闻文章数据,记录了该媒体的新闻报道内容及相关信息。主要特征如下:...
    packageimg
  • 文本中的图形数据集GraphsinTextDataset-ghanender

    2025年4月26日   

    文本中的图形数据集GraphsinTextDataset-ghanender 数据来源:互联网公开数据 标签:自然语言处理,图形识别,数据集,文本分析,机器学习,模式识别,信息提取,计算机视觉 数据概述: 该数据集包含来自多个文本来源的数据,记录了文本中出现的图形及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74

    2025年4月26日   

    新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本生成,数据集,机器学习,文本处理,信息提取,人工智能 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的摘要,记录了新闻内容与摘要之间的映射关系。主要特征如下:...
    packageimg
  • 文本摘要数据集TextSummarizationDataset-cuitengfeui

    2025年4月26日   

    文本摘要数据集TextSummarizationDataset-cuitengfeui 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,人工智能,语言学,信息提取,文本分析 数据概述:该数据集包含来自多个来源的文本摘要数据,记录了原文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 命名实体识别数据集NERDatasets-a7med7m0stvfa

    2025年4月26日   

    命名实体识别数据集NERDatasets-a7med7m0stvfa 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据集,人工智能,信息提取,语言技术 数据概述: 该数据集包含多种文本数据,记录了文本中的命名实体信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段的文本数据。...
    packageimg
  • 安然公司行动项检测数据集EnronActionItemDetectionDataset-scottisaacson

    2025年4月26日   

    安然公司行动项检测数据集EnronActionItemDetectionDataset-scottisaacson 数据来源:互联网公开数据 标签:企业邮件,文本分析,数据集,自然语言处理,机器学习,信息提取,商业智能,法律合规 数据概述: 该数据集包含来自安然公司(Enron...
    packageimg
  • 新闻分类与情感检测数据集NewsClassificationandEmotionDetectionDataset-razamukhtar007

    2025年4月26日   

    新闻分类与情感检测数据集NewsClassificationandEmotionDetectionDataset-razamukhtar007 数据来源:互联网公开数据 标签:新闻分类,情感检测,数据集,自然语言处理,机器学习,文本分析,情感识别,信息提取...
    packageimg
  • 俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu

    2025年4月25日   

    俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu 数据来源:互联网公开数据 标签:新闻数据,数据集,媒体分析,文本挖掘,自然语言处理,信息提取,学术研究,新闻传播 数据概述:该数据集包含来自俄罗斯高等经济学院(HSE)的新闻数据,记录了该学院发布的各类新闻和公告。主要特征如下:...
    packageimg
  • 人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal

    2025年4月25日   

    人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal 数据来源:互联网公开数据 标签:人工智能,文章抓取,数据清理,自然语言处理,机器学习,文本分析,信息提取,数据集 数据概述:...
    packageimg
  • 医学文献自然语言处理数据集PreprocessedPubMed200kRCTDataset-aliakseibrown

    2025年4月25日   

    医学文献自然语言处理数据集PreprocessedPubMed200kRCTDataset-aliakseibrown 数据来源:互联网公开数据 标签:医学文献,自然语言处理,数据集,文本分析,机器学习,医学研究,文本分类,学术资源...
    packageimg
  • 金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021

    2025年4月25日   

    金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021 数据来源:互联网公开数据 标签:金融,新闻,数据集,文本分析,自然语言处理,机器学习,市场研究,信息提取 数据概述: 该数据集包含来自互联网公开渠道的金融新闻数据,记录了金融领域的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29

    2025年4月25日   

    命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,信息提取,语言技术,人工智能 数据概述: 该数据集包含用于命名实体识别任务的数据,记录了文本中的实体及其类别信息。主要特征如下:...
    packageimg
  • 消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi

    2025年4月25日   

    消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,信息提取,情感分析,语言模型,数据挖掘 数据概述: 该数据集包含来自互联网的各类消息文本数据,记录了不同类型消息的内容和分类标签。主要特征如下:...
    packageimg
  • 文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23

    2025年4月25日   

    文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:...
    packageimg
  • 微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves

    2025年4月25日   

    微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:...
    packageimg
  • 数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino

    2025年4月25日   

    数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:数据分析,数据集,统计分析,机器学习,数据挖掘,信息提取,研究工具,数据科学 数据概述: 该数据集包含来自公开数据源的分析数据,记录了数据集中各变量的重要性和关联性分析结果。主要特征如下:...
    packageimg