找到5,805个数据集

标签: 文本分析

过滤结果
  • 中国歌曲歌词数据集ChineseSongLyricsDataset-jyesawtellrickson

    2025年4月23日   

    中国歌曲歌词数据集ChineseSongLyricsDataset-jyesawtellrickson 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,文本分析,情感分析,机器学习,文化研究 数据概述: 该数据集包含来自中国音乐平台和公开歌词库的歌曲歌词数据,记录了各类中文歌曲的歌词内容。主要特征如下:...
    packageimg
  • 文章主题数据集ArticleTopicDataset-bhavyarajsinhzala

    2025年4月23日   

    文章主题数据集ArticleTopicDataset-bhavyarajsinhzala 数据来源:互联网公开数据 标签:文本分析,主题分类,数据集,自然语言处理,机器学习,信息提取,内容分析,学术研究 数据概述: 该数据集包含来自互联网公开渠道的文章主题数据,记录了各类文章的主题分类信息。主要特征如下:...
    packageimg
  • 手机评分预测数据集-klmsathish

    2025年4月23日   

    手机评分预测数据集-klmsathish 数据来源:互联网公开数据 标签:手机,评分预测,数据集,机器学习,自然语言处理,文本分析,用户评价,产品分析 数据概述:该数据集包含来自多个来源的手机用户评价数据,旨在用于手机评分预测任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但涵盖了多个手机型号和发布时间。...
    packageimg
  • Twitter推文数据集TwitterTweetDataDataset-pratikpujarichef

    2025年4月23日   

    Twitter推文数据集TwitterTweetDataDataset-pratikpujarichef 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,自然语言处理,大数据,舆情监测 数据概述: 该数据集包含来自Twitter平台的大量推文数据,记录了用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 推特社交媒体文本分析数据集TwitterDataAnalysisNLPDataset-tanmayb8055

    2025年4月23日   

    推特社交媒体文本分析数据集TwitterDataAnalysisNLPDataset-tanmayb8055 数据来源:互联网公开数据 标签:社交媒体,推特,文本分析,自然语言处理,情感分析,数据挖掘,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)平台的公开数据,记录了用户发布的推文文本信息。主要特征如下:...
    packageimg
  • 孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas

    2025年4月23日   

    孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:...
    packageimg
  • 虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo

    2025年4月23日   

    虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,新闻传播,社会研究 数据概述: 该数据集包含经过预处理的虚假新闻数据,记录了不同来源的虚假新闻文章及其相关信息。主要特征如下:...
    packageimg
  • 植物病害诊断对话数据集-rahulrwl

    2025年4月23日   

    植物病害诊断对话数据集-rahulrwl 数据来源:互联网公开数据 标签:植物病害,诊断,对话,自然语言处理,机器学习,农业,疾病识别,文本分析 数据概述: 该数据集包含植物病害诊断相关的对话记录,记录了用户与诊断系统之间的互动。主要特征如下: 时间跨度: 数据记录的时间范围为不确定,取决于对话的收集时间。 地理范围:...
    packageimg
  • 负面评论数据集NegativeCommentsDataset-yuzhe2020

    2025年4月23日   

    负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:...
    packageimg
  • 多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai

    2025年4月23日   

    多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai 数据来源:互联网公开数据 标签:多语言问答,印地语,数据集,自然语言处理,机器学习,文本分析,问答系统,语言技术 数据概述: 该数据集包含来自多语言问答系统(MLQA)的印地语数据,记录了包含问题和对应答案的问答对。主要特征如下:...
    packageimg
  • 法律文章分析数据集LegalArticlesDataset-saidgrich

    2025年4月23日   

    法律文章分析数据集LegalArticlesDataset-saidgrich 数据来源:互联网公开数据 标签:法律文章,数据集,文本分析,法学研究,自然语言处理,法律咨询,法律知识,法律教育 数据概述: 该数据集包含来自多个法律网站和法律数据库的法律文章数据,记录了各类法律文件,案例分析和法律评论等详细信息。主要特征如下:...
    packageimg
  • Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3

    2025年4月23日   

    Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3 数据来源:互联网公开数据 标签:情感分析,用户评论,数据集,自然语言处理,机器学习,文本分析,市场研究,客户反馈 数据概述:...
    packageimg
  • 网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz

    2025年4月23日   

    网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,社交媒体,机器学习,自然语言处理,数据分析,社会研究 数据概述:该数据集包含来自社交媒体平台的文本数据,记录了用户之间的互动,特别是涉及网络欺凌的评论和消息。主要特征如下:...
    packageimg
  • 维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv

    2025年4月23日   

    维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:...
    packageimg
  • IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia

    2025年4月23日   

    IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本分析,机器学习,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
    packageimg
  • 巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr

    2025年4月23日   

    巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr 数据来源:互联网公开数据 标签:巴西音乐,歌词,数据集,文本分析,自然语言处理,文化研究,音乐研究,诗歌分析 数据概述:该数据集包含来自巴西的歌曲歌词数据,记录了不同年代,风格和语言的巴西歌曲歌词。主要特征如下:...
    packageimg
  • 电影信息聊天机器人数据集-vantanle71

    2025年4月23日   

    电影信息聊天机器人数据集-vantanle71 数据来源:互联网公开数据 标签:电影,数据集,聊天机器人,自然语言处理,情感分析,推荐系统,电影评论,文本分析 数据概述: 该数据集包含电影的详细信息,旨在用于构建电影信息聊天机器人。主要特征如下: 时间跨度: 数据涵盖了从电影上映至今的电影数据。 地理范围: 数据主要来源于全球范围内的电影信息。...
    packageimg
  • 法律领域命名实体识别数据集-pratikpujarichef

    2025年4月23日   

    法律领域命名实体识别数据集-pratikpujarichef 数据来源:互联网公开数据 标签:命名实体识别,法律,自然语言处理,文本分析,数据集,机器学习,司法,合同 数据概述: 该数据集包含从法律文本中提取的命名实体数据,旨在用于法律领域的命名实体识别(NER)任务。主要特征如下: 时间跨度:数据覆盖的时间范围不限,主要取决于收集到的法律文本的时间。...
    packageimg
  • 消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam

    2025年4月23日   

    消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam 数据来源:互联网公开数据 标签:情感分析,电商,数据集,自然语言处理,机器学习,消费者行为,文本分析,商业智能 数据概述: 该数据集包含来自电商平台的消费者评论数据,记录了用户对商品的情感倾向和评价。主要特征如下:...
    packageimg
  • 垃圾短信检测数据集SMSSpamDataset-hanzvivatma

    2025年4月23日   

    垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...
    packageimg