-
数据2020至2023年英超转会新闻文章数据集-crxxom
2020至2023年英超转会新闻文章数据集-crxxom 数据来源:互联网公开数据 标签:足球,转会市场,新闻,英超,自然语言处理,NLP,90min.com,体育新闻 数据概述:... -
新闻真伪辨别文本分类数据集-neupane9sujal
新闻真伪辨别文本分类数据集-neupane9sujal 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分类,自然语言处理,机器学习,标题,文本,标签 数据概述: 本数据集包含新闻文章的标题、正文以及真伪标签,可用于进行假新闻检测任务。数据集旨在帮助初学者学习文本分类技术,了解如何利用机器学习模型识别新闻的真伪。 数据包含以下字段:... -
斯瓦希里语句子标注数据集-2023-hassen7
斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:... -
-
亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar
亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar 数据来源:互联网公开数据 标签:亚马逊,Echo Dot,产品评论,情感分析,文本挖掘,自然语言处理,nltk,情感标签,消费者反馈 数据概述: 本数据集包含了从亚马逊印度站(amazon.in)上抓取的Echo Dot... -
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz 数据来源:互联网公开数据 标签:PII检测,教育数据,机器学习,自然语言处理,训练集,验证集,Kaggle,数据增强 数据概述: 本数据集是基于原始教育数据构建的,用于个人身份信息(PII,Personally Identifiable... -
电子商务嘈杂评论文本规范化数据集-sakshijain23
电子商务嘈杂评论文本规范化数据集-sakshijain23 数据来源:互联网公开数据 标签:电商评论,文本规范化,自然语言处理,短语识别,数据清洗,文本分析 数据概述:... -
ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir
ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir 数据来源:互联网公开数据 标签:ChatGPT, 评论, 用户反馈, 情感分析, 自然语言处理, 应用评估, Play Store, 移动应用, 多语言, 市场调研 数据概述: 本数据集包含100,000条来自Google Play... -
特朗普政府简报与声明数据集
特朗普政府简报与声明数据集 数据来源:互联网公开数据 标签:特朗普, 政府简报, 声明, 言论分析, 政策文本, 数据挖掘, 自然语言处理 数据概述 本数据集包含特朗普政府任期内所有公开的简报与声明内容,数据来源于白宫官方网站的“简报与声明”部分。数据集通过网络爬取方式获取,涵盖了特朗普政府期间发布的各类声明和简报,记录了其具体内容及相关元数据。... -
短信垃圾信息检测数据集-2023-faisalhossainruet
短信垃圾信息检测数据集-2023-faisalhossainruet 数据来源:互联网公开数据 标签:短信,垃圾信息,文本处理,NLP,预处理,自然语言处理,机器学习,数据集 数据概述:... -
科学家与公众人物推文数据集
科学家与公众人物推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,科学家,公众人物,时间序列,文本分析,自然语言处理 数据概述 本数据集包含来自多位活跃科学家和公众人物的推文记录,涵盖了从唐纳德·特朗普(Donald Trump)和希拉里·克林顿(Hillary Clinton)到尼尔·德格拉斯·泰森(Neil deGrasse... -
推特网络热门话题峰值检测数据集-milankalkenings
推特网络热门话题峰值检测数据集-milankalkenings 数据来源:互联网公开数据 标签:推特,社交媒体,话题分析,峰值检测,时间序列,文本挖掘,数据挖掘,自然语言处理,内容摘要,话题演化 数据概述:... -
多场景对话数据集-2023-itsashyadav
多场景对话数据集-2023-itsashyadav 数据来源:互联网公开数据 标签:对话数据,自然语言处理,社交互动,视频转录,人工智能,场景模拟,销售,事件讨论 数据概述:... -
人工智能论文摘要风格转换数据集-prathapkashyap
人工智能论文摘要风格转换数据集-prathapkashyap 数据来源:互联网公开数据 标签:人工智能,论文摘要,风格转换,自然语言处理,平行语料库,GPT-4,文本生成,风格迁移 数据概述:... -
乌克兰语情感分析调查问卷回复数据集-annzhukova340
乌克兰语情感分析调查问卷回复数据集-annzhukova340 数据来源:互联网公开数据 标签:乌克兰语,情感分析,文本分类,自然语言处理,调查数据,情感标签,机器学习,语言学 数据概述: 本数据集包含了18,000份以乌克兰语书写的调查问卷回复。 数据集经过平衡处理,包含: 9,000份正面回复 9,000份负面回复 每条记录由两部分组成:... -
LC-QuAD2-0问答数据集-thedevastator
LC-QuAD2-0问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答系统,SPARQL查询,Wikidata,DBpedia,自然语言处理,机器学习,教育,科研 数据概述: LC-QuAD 2.0... -
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei 数据来源:互联网公开数据 标签:ATIS,SNIPS,语音识别,槽位标注,意图识别,自然语言处理,SLU,对话系统 数据概述:... -
谷歌专利短语相似性评估数据集-google
谷歌专利短语相似性评估数据集-google 数据来源:互联网公开数据 标签:专利,短语相似性,技术术语,语义匹配,短语分类,自然语言处理,机器学习 数据概述:... -
情绪推断对话文本数据集-2011-thedevastator
情绪推断对话文本数据集-2011-thedevastator 数据来源:互联网公开数据 标签:情绪推断,对话文本,情感识别,自然语言处理,机器学习,文本分析 数据概述:... -
巴基斯坦企业黄页数据集1990-2017-mpasha96
巴基斯坦企业黄页数据集1990-2017-mpasha96 数据来源:互联网公开数据 标签:巴基斯坦,企业黄页,本地经济,商业信息,数据挖掘,自然语言处理,聚类分析 数据概述:...