找到11,791个数据集

标签: 自然语言处理

过滤结果
  • 越南语文本分类数据集-trnthinph

    2025年4月23日   

    越南语文本分类数据集-trnthinph 数据来源:互联网公开数据 标签:越南语,文本分类,自然语言处理,数据集,情感分析,语言学,机器学习,文本挖掘 数据概述: 该数据集包含越南语文本数据,并按照不同的类别进行标注。主要特征如下: 时间跨度:数据记录的时间范围无明确限制,取决于文本的发布时间。...
    packageimg
  • CommonLit阅读理解文本摘要数据集-shinomoriaoshi

    2025年4月23日   

    CommonLit阅读理解文本摘要数据集-shinomoriaoshi 数据来源:互联网公开数据 标签:阅读理解,文本摘要,自然语言处理,机器学习,教育,数据集,文本分析,语言模型 数据概述:该数据集包含来自CommonLit网站的阅读理解文章及其对应的文本摘要。主要特征如下:...
    packageimg
  • 阿姆哈拉语新闻文本分类数据集

    2025年4月23日   

    阿姆哈拉语新闻文本分类数据集 数据来源:互联网公开数据 标签:阿姆哈拉语,新闻分类,文本分类,自然语言处理,机器学习, Ethiopic script,基准性能 数据概述:...
    packageimg
  • 垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha

    2025年4月23日   

    垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha 数据来源:互联网公开数据 标签:垃圾邮件,情感分析,数据集,文本分类,自然语言处理,机器学习,文本挖掘,信息检索 数据概述: 该数据集包含了电子邮件数据,用于垃圾邮件检测和情感分析任务。主要特征如下:...
    packageimg
  • 推特情感分析数据集-2023年-ikrambelgas

    2025年4月23日   

    推特情感分析数据集-2023年-ikrambelgas 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,社交媒体,文本挖掘,情感分类,数据集 数据概述: 本数据集旨在帮助解决从推特文本中检测情感的难题,适用于自然语言处理领域的研究和应用。数据集包含2023年收集的推特文本及其对应的情感标签,适用于情感分析任务。 数据集包含两列内容:...
    packageimg
  • 对话摘要生成数据集DialogSummarizationDataset-sukalp1899

    2025年4月23日   

    对话摘要生成数据集DialogSummarizationDataset-sukalp1899 数据来源:互联网公开数据 标签:对话摘要,数据集,自然语言处理,机器学习,文本分析,人工智能,语言模型,对话系统 数据概述:该数据集包含来自多个来源的对话记录及其对应的摘要,适用于对话摘要生成任务。主要特征如下:...
    packageimg
  • 推特助力股票市场增强数据集-girgismicheal

    2025年4月23日   

    推特助力股票市场增强数据集-girgismicheal 数据来源:互联网公开数据 标签:股票市场,推特数据,情感分析,自然语言处理,机器学习,金融科技,市场预测,社交媒体 数据概述:该数据集整合了推特数据与股票市场表现数据,旨在研究社交媒体信息对股票市场的影响。主要特征如下:...
    packageimg
  • 有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain

    2025年4月23日   

    有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,情感分析,网络安全,德语,仇恨言论 数据概述: 该数据集由Jigsaw竞赛提供,包含德语评论数据,用于有毒评论的识别和分类。主要特征如下:...
    packageimg
  • LLM科学评估300题数据集LLM-Sci-Eval300Dataset-wuwenmin

    2025年4月23日   

    LLM科学评估300题数据集LLM-Sci-Eval300Dataset-wuwenmin 数据来源:互联网公开数据 标签:大型语言模型, 科学评估, 数据集, 自然语言处理, 文本理解, 知识推理, 机器学习, 评估测试 数据概述: 该数据集 LLM-Sci-Eval 300...
    packageimg
  • 网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod

    2025年4月23日   

    网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod 数据来源:互联网公开数据 标签:仇恨言论,数据集,情感分析,自然语言处理,机器学习,社交媒体,文本分类,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了用户发布的内容及其标签,用于识别和分类仇恨言论。主要特征如下:...
    packageimg
  • 金融新闻情感分析数据集-kimo26

    2025年4月23日   

    金融新闻情感分析数据集-kimo26 数据来源:互联网公开数据 标签:金融,新闻,情感分析,自然语言处理,机器学习,文本分析,市场情绪,舆情分析 数据概述: 该数据集包含来自各种来源的金融新闻文本,并标注了对应的情感极性。主要特征如下: 时间跨度: 数据记录的时间范围取决于新闻来源,通常涵盖数年甚至更长时间。 地理范围:...
    packageimg
  • 推特数据集带标签TwitterDatasetwithLabels-basitkhan12

    2025年4月23日   

    推特数据集带标签TwitterDatasetwithLabels-basitkhan12 数据来源:互联网公开数据 标签:社交媒体,数据集,文本挖掘,情感分析,机器学习,自然语言处理,大数据,舆情分析 数据概述: 该数据集包含来自推特平台的公开数据,记录了用户发布的推文内容及其对应的标签信息。主要特征如下:...
    packageimg
  • 真假新闻识别数据集TrueFalseNewsRecognitionDataset-indhirasivasakthij

    2025年4月23日   

    真假新闻识别数据集TrueFalseNewsRecognitionDataset-indhirasivasakthij 数据来源:互联网公开数据 标签:新闻分析,数据集,机器学习,自然语言处理,信息验证,媒体研究,假新闻,事实核查 数据概述: 该数据集包含来自多个新闻来源的真假新闻数据,记录了大量新闻文章的真实性和可靠性。主要特征如下:...
    packageimg
  • BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

    2025年4月23日   

    BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:...
    packageimg
  • 多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56

    2025年4月23日   

    多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56 数据来源:互联网公开数据 标签:邮件分类,数据集,文本分析,机器学习,自然语言处理,信息分类,电子邮件,数据分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了不同类别的邮件内容。主要特征如下:...
    packageimg
  • 钓鱼网站网址检测数据集-biggbok

    2025年4月23日   

    钓鱼网站网址检测数据集-biggbok 数据来源:互联网公开数据 标签:钓鱼网站,网址检测,安全,机器学习,恶意软件,网络安全,数据集,自然语言处理 数据概述: 该数据集包含来自互联网的网址数据,用于钓鱼网站(也称网络钓鱼)的检测和识别。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的钓鱼网站网址。 地理范围:...
    packageimg
  • 中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar

    2025年4月23日   

    中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:...
    packageimg
  • Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp

    2025年4月23日   

    Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,网络文化,内容挖掘 数据概述: 该数据集包含来自Reddit平台的热门帖子标题数据,记录了平台上备受关注的帖子的标题信息。主要特征如下:...
    packageimg
  • 垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819

    2025年4月23日   

    垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819 数据来源:互联网公开数据 标签:垃圾短信,语音识别,数据集,机器学习,文本分析,自然语言处理,通信,反垃圾 数据概述: 该数据集包含了垃圾短信的语音识别结果,记录了通过语音识别技术转换后的垃圾短信文本数据。主要特征如下:...
    packageimg
  • 情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert

    2025年4月23日   

    情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert 数据来源:互联网公开数据 标签:情感分析,评论数据,数据集,自然语言处理,机器学习,文本分析,市场研究,用户体验 数据概述: 该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品,服务或内容的情感表达。主要特征如下:...
    packageimg