找到583个数据集

标签: NLP

过滤结果
  • 灾害相关推文自然语言处理数据集

    2025年4月14日   

    灾害相关推文自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,灾害,推文,文本分类,机器学习,情感分析,事件检测 数据概述: 本数据集包含来自Kaggle的“Disaster...
    packageimg
  • 罗马乌尔都语数据集

    2025年4月14日   

    罗马乌尔都语数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,自然语言处理,NLP,情感分析,电子商务,社交媒体,语言转换,词典资源 数据概述:...
    packageimg
  • 灾害推文数据集预处理版

    2025年4月14日   

    灾害推文数据集预处理版 数据来源:互联网公开数据 标签:灾害推文,文本预处理,NLP,社交媒体分析,灾害监测,紧急响应,数据清洗 数据概述: 本数据集通过对灾害相关的推文应用各种文本数据预处理技术进行清洗而成。数据集涵盖了经过清理和预处理的推文文本,为灾害监测和紧急响应分析提供了高质量的数据支持。 数据用途概述:...
    packageimg
  • 英国文学NLP标注短语数据集

    2025年4月14日   

    英国文学NLP标注短语数据集 数据来源:互联网公开数据 标签:英国文学,NLP,短语标注,作家,书籍,世纪,句子分析,文学研究 数据概述:...
    packageimg
  • 泰英混合语词频分析数据集

    2025年4月14日   

    泰英混合语词频分析数据集 数据来源:互联网公开数据 标签:泰英混合语,词频分析,自然语言处理,NLP,文本数据,语言学研究,数据集 数据概述:...
    packageimg
  • 医院评论数据集

    2025年4月14日   

    医院评论数据集 数据来源:互联网公开数据 标签:医院评论,印度班加罗尔,患者反馈,情感分析,NLP,医疗服务质量,公众意见,机器学习 数据概述: 本数据集包含了从印度班加罗尔各医院的Google...
    packageimg
  • 鲁比亚斯评论NLP数据集

    2025年4月14日   

    鲁比亚斯评论NLP数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,评论分析,情感分析,讽刺检测,Kaggle竞赛,文本数据 数据概述: 本数据集包含与“鲁比亚斯”相关的评论,涵盖了用户对鲁比亚斯的各类意见和反馈。数据集为自然语言处理(NLP)任务提供了丰富的文本样本,适合进行情感分析、讽刺检测等文本挖掘任务。 数据用途概述:...
    packageimg
  • 英国航空客户评论数据集

    2025年4月14日   

    英国航空客户评论数据集 数据来源:互联网公开数据 标签:英国航空,客户评论,自然语言处理,NLP,情感分析,客户痛点,旅行体验,航空行业 数据概述:...
    packageimg
  • 路透社新闻专线主题数据集

    2025年4月14日   

    路透社新闻专线主题数据集 数据来源:互联网公开数据 标签:新闻分类,路透社,媒体分析,NLP,新闻趋势,政治,经济,体育,文化,技术 数据概述: 本数据集基于新闻主题分类数据集,旨在用于新闻分类任务,涵盖了新闻文章的各种特征,如文章长度、关键词频率、文章基调和其它分类指标。数据集中的每篇文章都被标记为五个主要新闻类别之一:政治、经济、体育、文化和技术。...
    packageimg
  • 数据2019印度板球联赛IPL比赛评论数据集

    2025年4月14日   

    数据2019印度板球联赛IPL比赛评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度板球联赛,IPL,实时评论,比赛分析,NLP,文本标注,体育数据 数据概述 本数据集包含2019年印度板球联赛(IPL)所有比赛的球级(ball-level)实时评论数据,以及比赛概要信息。数据来源于ESPN...
    packageimg
  • 库尔德语假新闻数据集

    2025年4月14日   

    库尔德语假新闻数据集 数据来源:互联网公开数据 标签:假新闻检测,库尔德语,NLP,文本分类,新闻真实性,社交媒体内容,数据集 数据概述:...
    packageimg
  • 世界英语圣经公会议版数据集

    2025年4月14日   

    世界英语圣经公会议版数据集 数据来源:互联网公开数据 标签:世界英语圣经,公会议版,圣经,宗教,文本数据,NLP,情感分析,宗教研究 数据概述:...
    packageimg
  • 生成电子邮件垃圾邮件数据集

    2025年4月14日   

    生成电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据标注,合成数据,网络安全,文本数据,NLP,情感分析 数据概述: 本数据集包含一个CSV文件,该文件包含300条生成的电子邮件垃圾邮件消息。每个文件行代表一封单独的电子邮件,包括其标题和正文。该数据集旨在促进垃圾邮件电子邮件的分析和检测。...
    packageimg
  • 姓名与国家来源数据集

    2025年4月14日   

    姓名与国家来源数据集 数据来源:互联网公开数据 标签:姓名,国家,起源,多样性,NLP,自然语言处理,知识图谱,人名识别,文化研究,数据生成 数据概述:...
    packageimg
  • 新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月

    2025年4月14日   

    新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月 数据来源:互联网公开数据 标签:酒店评论,滨海湾金沙,TripAdvisor,用户评价,文本分析,NLP,情感分析,旅游,新加坡 数据概述:...
    packageimg
  • 阿斯利康抗新冠病毒推特数据集

    2025年4月14日   

    阿斯利康抗新冠病毒推特数据集 数据来源:互联网公开数据 标签:阿斯利康,新冠病毒,推特,情感分析,文本挖掘,NLP,社会媒体分析,公众意见 数据概述:...
    packageimg
  • Steam游戏用户评论情感分析数据集

    2025年4月14日   

    Steam游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:Steam游戏,用户评论,情感分析,推荐系统,NLP,文本挖掘,游戏评价 数据概述: 本数据集包含来自Steam平台的多个游戏的用户评论,以及用户是否推荐该游戏的标签。数据来源于AV JantaHack NLP...
    packageimg
  • 乌尔都语评论情感分类数据集

    2025年4月14日   

    乌尔都语评论情感分类数据集 数据来源:互联网公开数据 标签:乌尔都语,评论,情感分析,自然语言处理,NLP,社交媒体 数据概述:...
    packageimg
  • 自动化记者数据集

    2025年4月14日   

    自动化记者数据集 数据来源:互联网公开数据 标签:自动化记者,文本生成,NLP,新闻摘要,Reddit数据 数据概述: 本数据集来源于正在开发的自动化记者应用程序。数据包括从Reddit获取的对话记录以及由应用程序生成的新闻摘要和新闻内容。该数据集专门用于评估生成文本的质量,适用于自然语言处理(NLP)项目的评估和改进。 数据用途概述:...
    packageimg
  • Reddit问答社区用户提问数据集-AskReddit等-2023

    2025年4月14日   

    Reddit问答社区用户提问数据集-AskReddit等-2023 数据来源:互联网公开数据 标签:Reddit,问答社区,用户提问,NLP,社会研究,数据分析,用户行为 数据概述:...
    packageimg