找到583个数据集

标签: NLP

过滤结果
  • 科技博客影响力博主识别数据集

    2025年4月14日   

    科技博客影响力博主识别数据集 数据来源:互联网公开数据 标签:科技博客,影响力分析,博主识别,文本挖掘,情感分析,NLP,网络爬虫 数据概述:...
    packageimg
  • 多年代视频游戏评论数据分析集2002-2023

    2025年4月14日   

    多年代视频游戏评论数据分析集2002-2023 数据来源:互联网公开数据 标签:视频游戏,评论分析,游戏设计,行业趋势,玩家偏好,NLP,机器学习,数据可视化 数据概述:...
    packageimg
  • 数据200-20新闻组文本分类数据集

    2025年4月14日   

    数据200-20新闻组文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,新闻组,文本预处理,机器学习,监督学习 数据概述: 本数据集是一个经过预处理的文本数据集合,来源为scikit-learn提供的20...
    packageimg
  • 戴尔推特情感分析数据集2022年前三季

    2025年4月14日   

    戴尔推特情感分析数据集2022年前三季 数据来源:互联网公开数据 标签:戴尔,推特,情感分析,情绪分析,2022年,社交媒体数据,NLP,文本分析,品牌声誉 数据概述:...
    packageimg
  • WinoGrande-常识推理挑战数据集

    2025年4月14日   

    WinoGrande-常识推理挑战数据集 数据来源:互联网公开数据 标签:自然语言处理,常识推理,文本理解,完形填空,机器阅读理解,AI,NLP 数据概述: WinoGrande是一个包含44,000个问题的集合,灵感来源于Winograd Schema...
    packageimg
  • 白宫演讲与讲话数据集

    2025年4月14日   

    白宫演讲与讲话数据集 数据来源:互联网公开数据 标签:白宫,演讲,讲话,情感分析,NLP,时间序列,地点分析,文本数据 数据概述: 本数据集包含1963年至2021年间白宫发布的1100篇演讲和讲话记录。数据集涵盖标题、演讲日期、地点和演讲文本等四个关键字段,为情感分析、自然语言处理等应用提供了丰富的文本资源。 数据用途概述:...
    packageimg
  • 推文情感提取扩展数据集

    2025年4月14日   

    推文情感提取扩展数据集 数据来源:互联网公开数据 标签:情感分析,推文,自然语言处理,NLP,扩展数据,特征提取,文本分析,数据处理 数据概述:...
    packageimg
  • 叔本华哲学研究著作文本数据集1774-1860

    2025年4月14日   

    叔本华哲学研究著作文本数据集1774-1860 数据来源:互联网公开数据 标签:叔本华,哲学,文本分析,NLP,语料库,德国古典哲学,时间序列 数据概述:...
    packageimg
  • 推特评论情感分析数据集-用户评论-2024

    2025年4月14日   

    推特评论情感分析数据集-用户评论-2024 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,用户评论,负面情绪,机器学习,NLP,评论数据 数据概述:...
    packageimg
  • 尼泊尔新闻文本分类数据集-多领域-2024

    2025年4月14日   

    尼泊尔新闻文本分类数据集-多领域-2024 数据来源:互联网公开数据 标签:尼泊尔,新闻,文本分类,政治,社会,体育,博客,国际,舆情分析,NLP 数据概述:...
    packageimg
  • BBC印地语新闻文章数据集

    2025年4月14日   

    BBC印地语新闻文章数据集 数据来源:互联网公开数据 标签:印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类 数据概述: 本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章,涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段: 标题(Headline):新闻文章的标题,用于概括新闻的主要内容。...
    packageimg
  • BBC新闻数据集-2226

    2025年4月14日   

    BBC新闻数据集-2226 数据来源:互联网公开数据 标签:BBC新闻,自然语言处理,NLP,文本分类,新闻标签,2004-2005,商业,娱乐,政治,体育,科技 数据概述:...
    packageimg
  • 印度板球联赛IPL2020数据集

    2025年4月14日   

    印度板球联赛IPL2020数据集 数据来源:互联网公开数据 标签:印度板球联赛, IPL, 板球赛事, 球员数据, 团队信息, NLP, 比赛分析, 实时更新, 评论数据, 球与球结果 数据概述:...
    packageimg
  • 牛津词典2015版A-Z单词列表数据集

    2025年4月14日   

    牛津词典2015版A-Z单词列表数据集 数据来源:互联网公开数据 标签:牛津词典,2015版,单词列表,NLP,自然语言处理,文本分析,词汇研究 数据概述: 本数据集包含了牛津2015版的A-...
    packageimg
  • 意大利TripAdvisor评论数据集

    2025年4月14日   

    意大利TripAdvisor评论数据集 数据来源:互联网公开数据 标签:TripAdvisor,意大利用户评论,旅游分析,情感分析,NLP,文本数据,评分系统 数据概述:...
    packageimg
  • 电影评论情感分析数据集-电影评论情感分析-2010

    2025年4月14日   

    电影评论情感分析数据集-电影评论情感分析-2010 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,NLP,情感分类,文本数据,电影,影评 数据概述:...
    packageimg
  • 基于症状的疾病标注数据集

    2025年4月14日   

    基于症状的疾病标注数据集 数据来源:互联网公开数据 标签:症状标注,疾病诊断,NLP,医疗应用,健康数据,自然语言处理 数据概述:...
    packageimg
  • 化妆品成分对比分析数据集

    2025年4月14日   

    化妆品成分对比分析数据集 数据来源:互联网公开数据 标签:化妆品,成分分析,NLP,机器学习,t-SNE,K-means,成分组合,行业研究,消费者决策 数据概述: 本数据集收录了大量化妆品产品的成分列表,通过自然语言处理(NLP)和机器学习技术,将成分信息转化为向量,并使用t-...
    packageimg
  • 古兰经全文及翻译数据集

    2025年4月14日   

    古兰经全文及翻译数据集 数据来源:互联网公开数据 标签:古兰经,宗教文本,翻译文本,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 印地语情感分析数据集

    2025年4月14日   

    印地语情感分析数据集 数据来源:互联网公开数据 标签:印地语,情感分析,NLP,自然语言处理,机器学习,情感分类,情绪识别 数据概述: 本数据集包含约8000条用印地语编写的句子,这些句子被分类为七个标签:中性、惊讶、恐惧、悲伤、快乐、厌恶和愤怒。该数据集为印地语句子的情感分析提供了基础,适用于自然语言处理或序列学习模型的应用。 数据用途概述:...
    packageimg