-
-
阿尔巴尼亚假新闻语料库
阿尔巴尼亚假新闻语料库 数据来源:互联网公开数据 标签:假新闻检测,自然语言处理,阿尔巴尼亚语,文本分类,数据研究,信息真实性评估,新闻传播学 数据概述: 本数据集源自研究论文《Albanian fake news...
-
-
-
YouTube-Twitter和短信垃圾信息数据集
YouTube-Twitter和短信垃圾信息数据集 数据来源:互联网公开数据 标签:垃圾信息,短信,社交媒体,YouTube,Twitter,文本数据,自然语言处理,垃圾邮件检测 数据概述: 本数据集整合了多个公开的垃圾信息数据集,旨在为垃圾信息检测、文本分类等研究提供数据资源。数据集主要由三部分组成:...
-
说唱歌词NLP数据集
说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki...
-
阿拉伯语新闻文本分类语料库
阿拉伯语新闻文本分类语料库 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,机器学习,语料库 数据概述: 本数据集包含以阿拉伯语撰写的新闻文本,涵盖了9个不同的新闻类别,以CSV格式存储。数据集旨在为阿拉伯语新闻文本的分类任务提供支持,包含数万条新闻数据,每条数据均标注了具体的类别信息。 数据用途概述:...
-
印度网民对科技产品情感分析数据集2021
印度网民对科技产品情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,社交媒体分析,自然语言处理,消费者反馈,科技产品,印度,文本分类 数据概述:...
-
推特情感分析竞赛伪标签推文数据集-2020年
推特情感分析竞赛伪标签推文数据集-2020年 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体 数据概述:...
-
星巴克评论数据集
星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
-
基于文本的分类数据集
基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -...
-
英国广播公司BBC新闻文章文本分类数据集
英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:...
-
以色列与哈马斯冲突新闻报道数据集2021-2023
以色列与哈马斯冲突新闻报道数据集2021-2023 数据来源:互联网公开数据 标签:以色列,哈马斯,中东冲突,新闻报道,媒体分析,情感分析,关键词提取,时间序列分析,文本分类 数据概述: 本数据集收录了2021年至2023年间来自Al Jazeera的以色列-...
-
StackOverflowPython3-0常见问题及解答数据集
StackOverflowPython3-0常见问题及解答数据集 数据来源:互联网公开数据 标签:Stack Overflow, Python 3.0, 编程问答, 自然语言处理, 常见问题, 代码, 技术支持, 问答系统 数据概述: 本数据集收录了Stack Overflow上关于Python...
-
Allociné法国电影评论情感分析数据集
Allociné法国电影评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析, 法语, 电影评论, 文本数据, 机器学习, 自然语言处理 数据概述: 本数据集源自Allociné电影评论,用于法国电影评论的情感分析研究。数据集由Theophile Blard创建并收集,包含约20万条电影评论,其中训练集约占80%,验证集和测试集各占10%。...
-
ODS-NLP多分类文本电影评分数据集2024
ODS-NLP多分类文本电影评分数据集2024 数据来源:互联网公开数据 标签:文本分类,多分类,电影评分,评分预测,NLP,机器学习,基线模型,对数回归,CatBoost,LSTM,Transformer 数据概述: 本数据集来自ODS(Open Data...
-
数据20新闻组文本分类研究数据集2023
数据20新闻组文本分类研究数据集2023 数据来源:互联网公开数据 标签:文本分类,自然语言处理,20新闻组,数据清洗,机器学习,情感分析,主题建模 数据概述: 本数据集是基于scikit-...
-
Phoronix科技新闻文章标题与内容数据集
Phoronix科技新闻文章标题与内容数据集 数据来源:互联网公开数据 标签:科技新闻,NLP,文本分析,自然语言处理,新闻文章,Phoronix,文章标题,文本数据,数据挖掘 数据概述:...
-
印度移动与非移动技术文章及推文数据集2023
印度移动与非移动技术文章及推文数据集2023 数据来源:互联网公开数据 标签:移动技术,非移动技术,文章,推文,文本分类,文本预处理,翻译,音译,印度,多语言 数据概述:...
-



