找到11,821个数据集

标签: 自然语言处理

过滤结果
  • 推特标签数据集LabelTweetsDataset-corinnedavidemakia

    2025年4月26日   

    推特标签数据集LabelTweetsDataset-corinnedavidemakia 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,情感分析,自然语言处理,数据集,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的推文数据,并附带标签,用于文本分析和情感分析等任务。主要特征如下:...
    packageimg
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg
  • 句子情感分析数据集AspectSentenceCSVDataset-costleyosaro

    2025年4月26日   

    句子情感分析数据集AspectSentenceCSVDataset-costleyosaro 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,评论分析,机器学习,情感分类,中文文本 数据概述: 该数据集包含来自用户评论的句子数据,旨在用于情感分析任务。主要特征如下:...
    packageimg
  • 书籍信息爬取数据集Books-to-Scrape-com-iamkkd

    2025年4月26日   

    书籍信息爬取数据集Books-to-Scrape-com-iamkkd 数据来源:互联网公开数据 标签:书籍,数据集,网络爬虫,图书信息,文本分析,自然语言处理,机器学习,图书推荐 数据概述: 该数据集包含了从Books-to-Scrape.com网站爬取的书籍信息,记录了各种书籍的详细信息。主要特征如下:...
    packageimg
  • 事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701

    2025年4月26日   

    事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701 数据来源:互联网公开数据 标签:事实核查,表格理解,零样本学习,自然语言处理,数据集,信息检索,人工智能,文本分析 数据概述: 该数据集源自TabFact项目,专注于表格事实核查任务,特别是在零上下文设置下进行。主要特征如下:...
    packageimg
  • 教育文本可读性评估数据集CommonLitDatasets-crxxom

    2025年4月26日   

    教育文本可读性评估数据集CommonLitDatasets-crxxom 数据来源:互联网公开数据 标签:教育研究,文本可读性,数据集,机器学习,自然语言处理,阅读评估,教学质量,教育科技 数据概述: 该数据集由 CommonLit 项目提供,包含用于评估教育文本可读性的数据,适用于文本难度分级,阅读能力评估等任务。主要特征如下:...
    packageimg
  • 科学文本分类数据集ScientificTextClassificationDataset-chiragb254

    2025年4月26日   

    科学文本分类数据集ScientificTextClassificationDataset-chiragb254 数据来源:互联网公开数据 标签:科学文本,数据集,文本分类,机器学习,自然语言处理,数据挖掘,学术研究,信息检索 数据概述:...
    packageimg
  • 医学考试患者笔记数据集NBMEPatientNotesDataset-cnjameshu

    2025年4月26日   

    医学考试患者笔记数据集NBMEPatientNotesDataset-cnjameshu 数据来源:互联网公开数据 标签:医学教育,患者笔记,数据集,自然语言处理,机器学习,临床诊断,人工智能,医学研究 数据概述: 该数据集包含来自美国国家医学考试委员会(NBME)的患者笔记数据,记录了医学生在医学考试中撰写的患者病情描述。主要特征如下:...
    packageimg
  • Jigsaw-Calpis001输出数据集Jigsaw-Calpis001OutputDataset-calpis10000

    2025年4月26日   

    Jigsaw-Calpis001输出数据集Jigsaw-Calpis001OutputDataset-calpis10000 数据来源:互联网公开数据 标签:数据分析,机器学习,数据集,预测模型,数据处理,算法评估,自然语言处理,人工智能 数据概述: 该数据集由 Jigsaw-Calpis...
    packageimg
  • 文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc

    2025年4月26日   

    文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc 数据来源:互联网公开数据 标签:情感分析,文本分类,数据集,自然语言处理,机器学习,情感识别,中文文本,多分类 数据概述: 该数据集包含大量的中文文本数据,标注了多种情感类别,用于文本情感多分类任务。主要特征如下:...
    packageimg
  • 政治人物推特数据分析数据集TwitterDatasetofPolitician-chiragpandav

    2025年4月26日   

    政治人物推特数据分析数据集TwitterDatasetofPolitician-chiragpandav 数据来源:互联网公开数据 标签:推特数据,政治人物,社交媒体,文本分析,舆情分析,自然语言处理,机器学习,政治学 数据概述:...
    packageimg
  • 推特训练数据集TwitterTrainingDataset-compellingdemigod

    2025年4月26日   

    推特训练数据集TwitterTrainingDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,情感识别 数据概述: 该数据集包含来自推特的公开数据,记录了用户发布的推文及其相关信息。主要特征如下:...
    packageimg
  • 餐厅评分与菜系分析数据集Pre-DataRestaurantRatings-CuisinesDataset-dmitryvvlasov

    2025年4月26日   

    餐厅评分与菜系分析数据集Pre-DataRestaurantRatings-CuisinesDataset-dmitryvvlasov 数据来源:互联网公开数据 标签:餐厅,评分,菜系,数据抓取,美食,餐馆,自然语言处理,情感分析 数据概述: 该数据集包含从网络抓取获得的餐厅评分和菜系信息,记录了餐厅的顾客评分,菜系种类等详细数据。主要特征如下:...
    packageimg
  • 数据3B规模的民事诉讼摘要数据集3B-CivilSumDataset-veerchheda

    2025年4月26日   

    3B规模的民事诉讼摘要数据集3B-CivilSumDataset-veerchheda 数据来源:互联网公开数据 标签:民事诉讼,摘要,数据集,自然语言处理,文本摘要,法律,机器学习,司法 数据概述: 该数据集包含来自美国民事诉讼案件的文本数据,旨在用于民事诉讼案件摘要生成任务。主要特征如下:...
    packageimg
  • 推特热点话题分析数据集Trend-CentricTwitterDataset-suruchigera

    2025年4月26日   

    推特热点话题分析数据集Trend-CentricTwitterDataset-suruchigera 数据来源:互联网公开数据 标签:推特,社交媒体,热点话题,文本分析,自然语言处理,情感分析,数据挖掘,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与各种热点话题相关的推文信息。主要特征如下:...
    packageimg
  • 语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet

    2025年4月26日   

    语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet 数据来源:互联网公开数据 标签:语法修正,说服文本,自然语言处理,文本分析,机器学习,语言学,数据集,文本生成 数据概述: 该数据集包含经过语法修正的说服性文本数据,适用于自然语言处理和文本生成等任务。主要特征如下:...
    packageimg
  • 评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr

    2025年4月26日   

    评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,机器学习,消费者行为,产品评价,数据分析 数据概述:该数据集包含来自电商平台的商品评论数据,记录了用户对产品的评价和反馈。主要特征如下:...
    packageimg
  • 亚马逊公司员工职位评价数据集AmazonJobReviewsfromIndeed-com-lgalbavt

    2025年4月26日   

    亚马逊公司员工职位评价数据集AmazonJobReviewsfromIndeed-com-lgalbavt 数据来源:互联网公开数据 标签:亚马逊,员工评价,职位,数据集,文本分析,情感分析,自然语言处理,人力资源 数据概述: 该数据集包含来自Indeed.com的亚马逊公司员工职位评价数据,记录了员工对亚马逊公司不同职位的评价和反馈。主要特征如下:...
    packageimg
  • UIT问答数据集UITQADataset-callmelee117

    2025年4月26日   

    UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:...
    packageimg
  • 文本摘要数据集TextSummarizationDataset-cuitengfeui

    2025年4月26日   

    文本摘要数据集TextSummarizationDataset-cuitengfeui 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,人工智能,语言学,信息提取,文本分析 数据概述:该数据集包含来自多个来源的文本摘要数据,记录了原文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg