找到11,795个数据集

标签: 自然语言处理

过滤结果
  • TUAW博客影响力分析数据集2008-lakritidis

    2025年4月23日   

    TUAW博客影响力分析数据集2008-lakritidis 数据来源:互联网公开数据 标签:TUAW,博客,影响力分析,时间序列,文本挖掘,自然语言处理,技术博客 数据概述: 本数据集包含2008年12月对The Unofficial Apple Weblog...
    packageimg
  • 安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22

    2025年4月23日   

    安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22 数据来源:互联网公开数据 标签:用户评论,应用商店,数据集,文本分析,情感分析,机器学习,自然语言处理,用户体验 数据概述: 该数据集包含来自安卓应用商店的用户评论数据,记录了用户对各类应用的反馈和评价。主要特征如下:...
    packageimg
  • 文学作品按体裁分类数据集-mehedihasan9021

    2025年4月23日   

    文学作品按体裁分类数据集-mehedihasan9021 数据来源:互联网公开数据 标签:文学,数据集,文本分析,自然语言处理,情感分析,分类,语料库,文本挖掘 数据概述: 该数据集包含按体裁分类的文学作品数据,旨在为文本分析和自然语言处理研究提供丰富的语料。主要特征如下: 时间跨度:数据涵盖不同时期和时代的文学作品。...
    packageimg
  • 推特多类别情感分析数据集TwitterMulti-ClassSentimentAnalysisDataset-ak2033

    2025年4月23日   

    推特多类别情感分析数据集TwitterMulti-ClassSentimentAnalysisDataset-ak2033 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本挖掘,机器学习,自然语言处理,数据科学,情感分类 数据概述: 该数据集包含来自推特平台的多类别情感分析数据,记录了推文内容的情感极性。主要特征如下:...
    packageimg
  • 电影评论数据集5万条50kMovieReviewDataset-samrat12

    2025年4月23日   

    电影评论数据集5万条50kMovieReviewDataset-samrat12 数据来源:互联网公开数据 标签:电影评论,自然语言处理,数据集,情感分析,机器学习,文本挖掘,消费者行为,文化研究 数据概述: 该数据集包含来自互联网的5万条电影评论,记录了用户对电影的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。...
    packageimg
  • 英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe

    2025年4月23日   

    英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,语言学习,数据集,英语,尼泊尔语,文本翻译,语言技术...
    packageimg
  • 微生物学问答数据集MicrobiologyQ-ADataset-moonstone34

    2025年4月23日   

    微生物学问答数据集MicrobiologyQ-ADataset-moonstone34 数据来源:互联网公开数据 标签:微生物学,问答系统,数据集,自然语言处理,医学研究,机器学习,健康科学,教育 数据概述: 该数据集包含来自多个医学和科学领域的微生物学问答数据,适用于自然语言处理,机器学习和医学研究等任务。主要特征如下:...
    packageimg
  • 在线新闻流行度数据集-nglemmanuel

    2025年4月23日   

    在线新闻流行度数据集-nglemmanuel 数据来源:互联网公开数据 标签:在线新闻,流行度,数据集,自然语言处理,机器学习,社交媒体,新闻分析,内容营销 数据概述:该数据集包含来自葡萄牙新闻网站的在线新闻文章数据,记录了每篇文章的特征和流行度指标。主要特征如下: 时间跨度:数据记录的时间范围从2013年9月到2018年1月。...
    packageimg
  • 基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99

    2025年4月23日   

    基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99 数据来源:互联网公开数据 标签:钓鱼欺诈检测,自然语言处理,NLP,邮件安全,机器学习,文本分析,欺诈识别,安全防护 数据概述:...
    packageimg
  • TapTap平台手游玩家评价情感分析数据集-griffith000

    2025年4月23日   

    TapTap平台手游玩家评价情感分析数据集-griffith000 数据来源:互联网公开数据 标签:手游,游戏评论,情感分析,自然语言处理,TapTap,用户反馈,文本分类,中国,移动游戏 数据概述: 本数据集收录了TapTap平台上手机游戏的玩家评论数据,旨在用于情感分析研究。...
    packageimg
  • 印地语维基百科数据集HindiWikipediaDataset-vjdwary

    2025年4月23日   

    印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:...
    packageimg
  • 德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch

    2025年4月23日   

    德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-...
    packageimg
  • 阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad

    2025年4月23日   

    阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad 数据来源:互联网公开数据 标签:新闻评论,数据集,文本分析,情感分析,自然语言处理,机器学习,阿塞拜疆语,语言技术 数据概述: 该数据集包含来自阿塞拜疆新闻网站BİLDİR AZ的用户评论数据,记录了用户对新闻内容的反馈和观点。主要特征如下:...
    packageimg
  • 歌词标注数据集LyricsMarkupDataset-idwntl

    2025年4月23日   

    歌词标注数据集LyricsMarkupDataset-idwntl 数据来源:互联网公开数据 标签:歌词,数据集,文本标注,自然语言处理,音乐分析,文化研究,词频分析,情感分析 数据概述: 该数据集包含来自互联网的歌词文本,记录了各种歌曲的歌词及其标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
    packageimg
  • 英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas

    2025年4月23日   

    英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:...
    packageimg
  • 新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia

    2025年4月23日   

    新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia 数据来源:互联网公开数据 标签:新冠疫情,推文数据,社交媒体,自然语言处理,情感分析,疫情研究,数据挖掘,文本分析 数据概述: 该数据集包含来自Twitter的关于新冠疫情的推文数据,记录了全球范围内用户在社交媒体上对疫情的讨论和观点。主要特征如下:...
    packageimg
  • Telegram电报垃圾消息检测数据集-kartikaytandon

    2025年4月23日   

    Telegram电报垃圾消息检测数据集-kartikaytandon 数据来源:互联网公开数据 标签:垃圾消息,电报,数据集,自然语言处理,机器学习,文本分类,社交媒体,信息安全 数据概述:该数据集包含了来自 Telegram 电报平台的垃圾消息数据,旨在用于垃圾消息检测和分类。主要特征如下:...
    packageimg
  • 语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030

    2025年4月23日   

    语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,数据挖掘,人工智能 数据概述: 该数据集包含来自多个语言样本的文本数据,记录了不同语言的文本片段及其对应的语言标签。主要特征如下:...
    packageimg
  • 餐饮评论情感分析数据集RestaurantReviewsSentimentAnalysisDataset-akashdasp

    2025年4月23日   

    餐饮评论情感分析数据集RestaurantReviewsSentimentAnalysisDataset-akashdasp 数据来源:互联网公开数据 标签:餐饮评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,商业智能,用户反馈 数据概述: 该数据集包含来自各大餐饮平台的用户评论数据,记录了消费者对餐厅的评价和反馈。主要特征如下:...
    packageimg
  • 推特用户情感分析研究推文情感数据集-dhruvlotia

    2025年4月23日   

    推特用户情感分析研究推文情感数据集-dhruvlotia 数据来源:互联网公开数据 标签:推特,推文,情感分析,自然语言处理,文本挖掘,社交媒体,情感倾向,机器学习 数据概述: 本数据集包含来自推特(Twitter)的推文数据,旨在用于情感分析研究。每条数据记录均由以下字段构成: id:推文的唯一标识符。...
    packageimg