找到144个数据集

标签: 信息提取

过滤结果
  • 人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal

    2025年4月25日   

    人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal 数据来源:互联网公开数据 标签:人工智能,文章抓取,数据清理,自然语言处理,机器学习,文本分析,信息提取,数据集 数据概述:...
    packageimg
  • 金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021

    2025年4月25日   

    金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021 数据来源:互联网公开数据 标签:金融,新闻,数据集,文本分析,自然语言处理,机器学习,市场研究,信息提取 数据概述: 该数据集包含来自互联网公开渠道的金融新闻数据,记录了金融领域的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29

    2025年4月25日   

    命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,信息提取,语言技术,人工智能 数据概述: 该数据集包含用于命名实体识别任务的数据,记录了文本中的实体及其类别信息。主要特征如下:...
    packageimg
  • 消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi

    2025年4月25日   

    消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,信息提取,情感分析,语言模型,数据挖掘 数据概述: 该数据集包含来自互联网的各类消息文本数据,记录了不同类型消息的内容和分类标签。主要特征如下:...
    packageimg
  • 文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23

    2025年4月25日   

    文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:...
    packageimg
  • 微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves

    2025年4月25日   

    微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:...
    packageimg
  • 数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino

    2025年4月25日   

    数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:数据分析,数据集,统计分析,机器学习,数据挖掘,信息提取,研究工具,数据科学 数据概述: 该数据集包含来自公开数据源的分析数据,记录了数据集中各变量的重要性和关联性分析结果。主要特征如下:...
    packageimg
  • BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban

    2025年4月25日   

    BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
    packageimg
  • 乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz

    2025年4月25日   

    乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz 数据来源:互联网公开数据 标签:新闻文本,文本分类,乌尔都语,数据集,自然语言处理,机器学习,语言技术,信息提取 数据概述:...
    packageimg
  • 命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03

    2025年4月25日   

    命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
    packageimg
  • 新闻深度处理数据集NewsDeepProcessedDataset-mario123475

    2025年4月25日   

    新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:...
    packageimg
  • 图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa

    2025年4月25日   

    图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:...
    packageimg
  • 网页内容与词法特征提取数据集2022年-vanshhagrawal

    2025年4月25日   

    网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:...
    packageimg
  • AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii

    2025年4月25日   

    AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda

    2025年4月25日   

    僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 简历数据分析数据集ResumeDataAnalysisDataset-someetsingh

    2025年4月25日   

    简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
    packageimg
  • 地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan

    2025年4月24日   

    地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:...
    packageimg
  • 最终内容数据集FinalContentDataset-akash1vishwakarma

    2025年4月24日   

    最终内容数据集FinalContentDataset-akash1vishwakarma 数据来源:互联网公开数据 标签:内容分析,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息提取,知识管理 数据概述:该数据集包含来自多个来源的内容数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m

    2025年4月24日   

    丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m 数据来源:互联网公开数据 标签:新闻数据,数据采集,数据集,文本分析,自然语言处理,机器学习,信息提取,数据挖掘 数据概述: 该数据集包含来自越南丹特里新闻网站(Dantri)的数据,记录了该网站的新闻文章内容。主要特征如下:...
    packageimg
  • 灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh

    2025年4月24日   

    灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh 数据来源:互联网公开数据 标签:灾害管理,社交网络,数据集,文本分析,机器学习,自然语言处理,危机响应,信息提取 数据概述:该数据集包含预处理过的推文数据,这些推文与自然灾害事件相关。主要特征如下:...
    packageimg