-
新闻文本分类与嵌入数据集_News_Text_Classification_and_Embedding_Dataset
新闻文本分类与嵌入数据集_News_Text_Classification_and_Embedding_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 嵌入, 多分类, 机器学习, 情感分析, 类别预测 数据概述:... -
中文新闻文本分类数据集_Chinese_News_Text_Classification
中文新闻文本分类数据集_Chinese_News_Text_Classification 数据来源:互联网公开数据 标签:文本分类, 新闻语料, 自然语言处理, 机器学习, 体育, 财经, 科技, 语料库 数据概述: 该数据集包含来自中文新闻的数据,记录了不同类别的新闻文本内容,主要用于文本分类任务。主要特征如下:... -
社交媒体仇恨言论检测推文数据集_Social_Media_Hate_Speech_Detection_Tweets
社交媒体仇恨言论检测推文数据集_Social_Media_Hate_Speech_Detection_Tweets 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 自然语言处理, 机器学习, 情感分析, 文本标注, 推文分析 数据概述: 该数据集包含来自Twitter平台的推文数据,旨在用于仇恨言论的检测与分析。主要特征如下:... -
新闻文本情感分析数据集_News_Text_Sentiment_Analysis
新闻文本情感分析数据集_News_Text_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻文本, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻文章的文本内容以及对应的情感极性标签。主要特征如下:... -
越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset
越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 自然语言处理, 机器学习, 情感极性, 语料库, 深度学习 数据概述: 该数据集包含来自越南社交媒体平台的用户评论文本,用于进行情感分析。主要特征如下:... -
企业邮件垃圾分类样本数据集
数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容... -
COVID-19新闻数据集
COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:... -
俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov
俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov 数据来源:互联网公开数据 标签:俄语,社交媒体,短文本,情感分析,毒性检测,文本分类,自然语言处理,机器学习,RuTweetCorp 数据概述: 本数据集源自论文《Рубцова Ю. Автоматическое построение и... -
德国政客党派归属预测数据集
德国政客党派归属预测数据集 数据来源:互联网公开数据 标签:德国政客,社交媒体分析,自然语言处理,政治倾向,机器学习,文本分类 数据概述: 本数据集基于对德国政客的Twitter数据进行收集和整理,包含了几乎全部德国政客的公开社交媒体信息。数据涵盖政客的文本内容、用户信息、互动记录等关键要素,为研究德国政客的党派归属及其相关特征提供了可靠的数据支持。... -
Sciphi中小学至研究生教材样本数据集-thedevastator
Sciphi中小学至研究生教材样本数据集-thedevastator 数据来源:互联网公开数据 标签:教材样本,教育研究,机器学习,数据集,开放源代码,文本分类,自然语言处理 数据概述:... -
社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证
社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,图像识别,文本分析,多模态学习,深度学习,图像分类,文本分类,自然语言处理,机器学习,人工智能,内容审核 数据概述:... -
arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr
arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr 数据来源:互联网公开数据 标签:学术论文,arXiv,多标签分类,文本分类,机器学习,计算机科学,人工智能,自然语言处理,数据集 数据概述:... -
雅虎问答10类别NLP数据集
雅虎问答10类别NLP数据集 数据来源:互联网公开数据 标签:问答分类,自然语言处理,NLP,文本分类,问答系统,文本分析,机器学习,主题分类 数据概述:... -
Reddit社区百万笑话文本数据集-thedevastator
Reddit社区百万笑话文本数据集-thedevastator 数据来源:互联网公开数据 标签:笑话,幽默,Reddit,文本数据,自然语言处理,机器学习,情感分析,内容生成,笑话生成,文本分类 数据概述:... -
亚马逊商品评论情感二元分类数据集-商品评论-2019
亚马逊商品评论情感二元分类数据集-商品评论-2019 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本分类,自然语言处理,机器学习,情感极性,负面评价,正面评价 数据概述:... -
亚马逊商品评论情感分析数据集-用户评价-大规模数据集
亚马逊商品评论情感分析数据集-用户评价-大规模数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,用户评价,文本分类,机器学习,自然语言处理,情感极性 数据概述:... -
维基百科推广文章数据集
维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -... -
人工智能与人类文本区分数据集
人工智能与人类文本区分数据集 数据来源:互联网公开数据 标签:人工智能,文本分类,文本转换,自然语言处理,NLP,数据分类,文本生成,文本质量评估 数据概述:... -
亚马逊商品评论情感分析数据集-用户评论-2018
亚马逊商品评论情感分析数据集-用户评论-2018 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本分类,用户反馈,机器学习,自然语言处理,评论数据 数据概述:... -
组合评论语料库数据集
组合评论语料库数据集 数据来源:互联网公开数据 标签:毒性评论,语言偏见,多语言分析,文本分类,自然语言处理,社会媒体,情感分析 数据概述: 本数据集整合了过去三年内的评论数据,涵盖了来自多个公开数据集的内容。数据集主要来源于三个关键的比赛任务: 1. 毒性评论分类挑战(Toxic Comment Classification...