找到5,855个数据集

标签: 文本分析

过滤结果
  • 亚马逊食品评价纠正评分数据集-2011至2021年-sunnysarma

    2025年5月31日   

    亚马逊食品评价纠正评分数据集-2011至2021年-sunnysarma 数据来源:互联网公开数据 标签:亚马逊,食品评价,评分,文本分析,机器学习,消费者反馈,正面负面分类 数据概述: 本数据集是基于Kaggle上已有的亚马逊美食评论数据集(AMAZON FINE FOOD...
    packageimg
  • 洁净版埃尼伦邮件数据集

    2025年5月31日   

    洁净版埃尼伦邮件数据集 数据来源:互联网公开数据 标签:埃尼伦,邮件数据,商业通信,时间序列,文本分析,邮件清理 数据概述: 本数据集包含埃尼伦邮件数据集中经过清理的电子邮件。数据已经预处理,包括4个特征:'日期', '发件人', '收件人', 和...
    packageimg
  • 摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100

    2025年5月31日   

    摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles...
    packageimg
  • PubMed医学论文摘要生成数据集-thedevastator

    2025年5月31日   

    PubMed医学论文摘要生成数据集-thedevastator 数据来源:互联网公开数据 标签:PubMed,医学论文,摘要生成,自然语言处理,文本摘要,科研,机器学习,文本分析 数据概述:...
    packageimg
  • AI艺术生成提示与随机文本数据集

    2025年5月31日   

    AI艺术生成提示与随机文本数据集 数据来源:互联网公开数据 标签:AI艺术生成,提示分类,随机文本检测,数据分类,文本生成,创意生成,文本分析 数据概述:...
    packageimg
  • 斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9

    2025年5月31日   

    斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,Ada Derana,斯里兰卡,NLP,自然语言处理,时间序列,文本分析,社会研究,媒体,2008-2024 数据概述: 本数据集是一个全面的新闻文章集合,来源于斯里兰卡Ada...
    packageimg
  • WELFake虚假新闻文本分类数据集-studymart

    2025年5月31日   

    WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述:...
    packageimg
  • 网络评论中仇恨言论检测数据集-2023年-cabmarcos

    2025年5月31日   

    网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:...
    packageimg
  • MDPI平台气候变化相关论文元数据数据集-devrajkashyap

    2025年5月31日   

    MDPI平台气候变化相关论文元数据数据集-devrajkashyap 数据来源:互联网公开数据 标签:气候变化,论文,元数据,MDPI,学术研究,自然语言处理,文本分析 数据概述: 本数据集包含了从MDPI(Multidisciplinary Digital Publishing...
    packageimg
  • 雅虎问答主题分类数据集-2011至2021年

    2025年5月31日   

    雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -...
    packageimg
  • 挪威议会演讲数据集1963-2021

    2025年4月14日   

    挪威议会演讲数据集1963-2021 数据来源:互联网公开数据 标签:挪威议会,演讲,政治党派,时间序列,文本分析,自然语言处理 数据概述:...
    packageimg
  • Kaggle论坛文本提取数据集-简版

    2025年5月31日   

    Kaggle论坛文本提取数据集-简版 数据来源:互联网公开数据 标签:Kaggle,论坛,文本提取,数据集,简版,机器学习,数据科学,社区讨论 数据概述: 本数据集是从Kaggle论坛中提取的文本和提示信息的简版数据集。它旨在提供Kaggle社区讨论和交流的内容,包含了大量的文本数据,适用于分析论坛内容、社区互动模式以及机器学习相关话题的讨论。...
    packageimg
  • 权力的游戏第八季推特用户评论数据集-2019-monogenea

    2025年5月31日   

    权力的游戏第八季推特用户评论数据集-2019-monogenea 数据来源:互联网公开数据 标签:权力的游戏,推特,社交媒体,文本分析,电视剧,评论,情感分析,数据挖掘 数据概述:...
    packageimg
  • 俄乌冲突新闻事件Telegram频道数据集-2022年2月24日至今-falloutbabe

    2025年5月31日   

    俄乌冲突新闻事件Telegram频道数据集-2022年2月24日至今-falloutbabe 数据来源:互联网公开数据 标签:俄乌冲突,新闻,Telegram,舆情分析,战争,地缘政治,媒体,社交媒体,文本分析,情感分析 数据概述:...
    packageimg
  • 印度Reddit论坛所有帖子数据集2023

    2025年5月31日   

    印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API...
    packageimg
  • 数据2020年美国大选推特选举舞弊言论数据集-paultimothymooney

    2025年5月31日   

    2020年美国大选推特选举舞弊言论数据集-paultimothymooney 数据来源:互联网公开数据 标签:推特,社交媒体,选举舞弊,美国大选,政治,言论分析,数据挖掘,谣言传播,文本分析 数据概述: 本数据集收录了2020年美国大选期间,推特(Twitter)平台上与选举舞弊相关的言论数据。...
    packageimg
  • 亚马逊广告数据集

    2025年5月31日   

    亚马逊广告数据集 数据来源:互联网公开数据 标签:广告分类,文本分析,监督学习,数据挖掘,广告文本,产品描述,市场营销 数据概述:...
    packageimg
  • IMDB电影评论情感分析数据集-2021-mirnasherif

    2025年5月31日   

    IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:...
    packageimg
  • 推特情感分析数据集-2009年-prox37

    2025年5月31日   

    推特情感分析数据集-2009年-prox37 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本分析,情感标注,数据集,2009年 数据概述: 本数据集包含2009年推特上的部分推文,经过处理后去除了表情符号。数据集以CSV格式存储,每条记录包含六个字段: 0 - 推文的情感极性(0表示负面,2表示中性,4表示正面) 1 -...
    packageimg
  • 科学论文与新闻稿匹配数据集-chenxinye

    2025年5月31日   

    科学论文与新闻稿匹配数据集-chenxinye 数据来源:互联网公开数据 标签:科学,论文,新闻,匹配,自然语言处理,文本分析,科研,媒体,标题,摘要 数据概述:...
    packageimg