找到560个数据集

标签: NLP

过滤结果
  • TripAdvisor旅行评论数据集-用于NLP任务-2021

    2025年5月6日   

    TripAdvisor旅行评论数据集-用于NLP任务-2021 数据来源:互联网公开数据 标签:TripAdvisor,旅行评论,自然语言处理,NLP,数据分析,机器学习,情感分析,个性化推荐,文本摘要 数据概述:...
    packageimg
  • 社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer

    2025年5月30日   

    社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:...
    packageimg
  • 越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl

    2025年5月30日   

    越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl 数据来源:互联网公开数据 标签:越南语,情感分析,社交媒体,数据集,自然语言处理,文本分析,机器学习,NLP 数据概述: 该数据集包含了来自越南社交媒体平台的用户文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan

    2025年5月30日   

    越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:...
    packageimg
  • Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills

    2025年5月30日   

    Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,情感分析,恶意评论,数据集,社交媒体,NLP 数据概述: 该数据集由 Jigsaw 团队提供,旨在用于检测在线评论中的恶意、侮辱性和攻击性言论。主要特征如下:...
    packageimg
  • 印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall

    2025年5月30日   

    印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:...
    packageimg
  • 推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch

    2025年5月30日   

    推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,自然语言处理,机器学习,文本分析,舆情分析,NLP 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • Alura词向量数据集AluraWord2VecDataset-romariogomesbr

    2025年5月30日   

    Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
    packageimg
  • 自然语言处理NLP职位描述数据集-koti4878m

    2025年5月30日   

    自然语言处理NLP职位描述数据集-koti4878m 数据来源:互联网公开数据 标签:自然语言处理,NLP,职位描述,文本分析,机器学习,招聘,数据挖掘,文本分类 数据概述:该数据集包含来自互联网的职位描述文本数据,主要记录了不同行业的职位描述信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不定,取决于爬取时间与数据来源。...
    packageimg
  • 标题:文本标题提取数据集(Hasninasri Title Extraction Dataset)

    2025年5月30日   

    标题:文本标题提取数据集(Hasninasri Title Extraction Dataset) 数据来源:互联网公开数据 标签:文本分析,标题提取,自然语言处理,机器学习,文本挖掘,NLP,数据集,信息检索 数据概述: 该数据集由Hasninasri提供,旨在用于文本标题的提取和生成任务,包含大量的文本内容及其对应的标题。主要特征如下:...
    packageimg
  • 诗歌创作与分析数据集PoemsData-lisaameliewittmann

    2025年5月30日   

    诗歌创作与分析数据集PoemsData-lisaameliewittmann 数据来源:互联网公开数据 标签:诗歌,数据集,自然语言处理,文本分析,情感分析,文学研究,创作,NLP 数据概述: 该数据集包含了来自互联网的各类诗歌作品,旨在为诗歌创作与分析提供数据支持。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了从古代到现代的诗歌作品。...
    packageimg
  • Synnax数据集竞赛第二期数据集-sukrucildirr

    2025年5月29日   

    Synnax数据集竞赛第二期数据集-sukrucildirr 数据来源:互联网公开数据 标签:机器学习,数据集,自然语言处理,文本分类,情感分析,竞赛,中文文本,NLP 数据概述: 该数据集是 Synnax 数据集竞赛第二期提供的数据集,主要用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但为竞赛提供,具有时效性。...
    packageimg
  • 阿拉伯语文本情感分析数据集-nanorfelixsam

    2025年5月29日   

    阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。...
    packageimg
  • 阿拉伯新闻文章标题生成数据集-oussamaseffai

    2025年5月29日   

    阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。...
    packageimg
  • CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych

    2025年5月29日   

    CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,机器翻译,数据集,文本分析,NLP 数据概述: 该数据集包含来自CNN新闻的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了新闻发布的时间段,具体时间范围未明确。...
    packageimg
  • 词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju

    2025年5月29日   

    词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,语义分析,向量空间,NLP 数据概述: 该数据集包含了使用Word2Vec模型训练得到的词向量结果,主要记录了词汇与其对应的向量表示。主要特征如下:...
    packageimg
  • 医学推文情感分析数据集Tweets-MedDataset-milanezeus

    2025年5月29日   

    医学推文情感分析数据集Tweets-MedDataset-milanezeus 数据来源:互联网公开数据 标签:医学,推文,情感分析,社交媒体,NLP,自然语言处理,情感识别,文本挖掘 数据概述: 该数据集包含来自Twitter的医学相关推文数据,记录了用户在社交媒体上对医疗健康话题的讨论和观点。主要特征如下:...
    packageimg
  • Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat

    2025年5月29日   

    Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92

    2025年5月29日   

    IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,文本挖掘,机器学习,情感分类,NLP 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov

    2025年5月29日   

    俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,新闻,俄语,NLP 数据概述: 该数据集包含来自俄罗斯新闻网站Lenta.ru的文本数据,用于情感分析任务。主要特征如下:...
    packageimg