-
电影剧本片段与电影类型匹配数据集-lykin22
电影剧本片段与电影类型匹配数据集-lykin22 数据来源:互联网公开数据 标签:电影,剧本,类型,文本分类,机器学习,自然语言处理,剧情,喜剧,动作,科幻,爱情,恐怖,冒险,悬疑 数据概述: 本数据集包含训练集和测试集两部分,旨在用于电影剧本片段的类型预测任务。训练集包括三个字段: id:记录的唯一标识符... -
电子邮件意图识别数据集-nikhilhestabit
电子邮件意图识别数据集-nikhilhestabit 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,电子邮件,意图识别,机器学习,情感分析,信息检索 数据概述: 该数据集包含来自电子邮件的数据,旨在用于电子邮件意图识别任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了多种不同时间段的电子邮件。... -
社交媒体互动与情感分析数据集
标题:社交媒体互动与情感分析数据集 数据内容: 本数据集包含来自互联网公开数据的社交媒体互动记录,具体数据元素包括:用户ID、社交媒体平台(如Facebook)、互动内容(如帖子或评论)、情感标签(如Positive、Irrelevant)、互动时间等。数据内容涵盖了用户在社交媒体上的各种互动行为及其情感倾向。 数据来源: 互联网公开数据 数据用途:... -
Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith
Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith 数据来源:互联网公开数据 标签:Jigsaw,毒性评论,评论分析,自然语言处理,NLP,竞赛,排行榜,机器学习,文本分类 数据概述: 本数据集是Jigsaw 毒性评论严重度排名竞赛的公共排行榜快照,于2021年12月27日下载。... -
越南虚假新闻数据集VietnameseFakeNewsDataset-sonwqh
越南虚假新闻数据集VietnameseFakeNewsDataset-sonwqh 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分类,新闻分析,数据挖掘,越南语 数据概述: 该数据集包含来自互联网的越南语新闻文章,旨在识别和分类虚假新闻。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2021年。... -
讽刺文本评价数据集-kolliparajaswanth030
讽刺文本评价数据集-kolliparajaswanth030 数据来源:互联网公开数据 标签:讽刺检测,情感分析,自然语言处理,文本分析,数据集,机器学习,语言学,文本分类 数据概述: 该数据集包含了用于讽刺文本评价的文本数据,旨在帮助研究人员和开发者构建和评估讽刺检测模型。主要特征如下: 时间跨度:数据收集时间不限,反映了不同时期和语境下的讽刺表达。... -
产品分类数据集-itsrohanism
产品分类数据集-itsrohanism 数据来源:互联网公开数据 标签:产品分类,数据集,文本分类,自然语言处理,机器学习,电商,商品信息,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,记录了各种产品的详细描述和类别标签。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期电商平台上的产品信息。... -
越南语情感分析数据集-datvuthanh
越南语情感分析数据集-datvuthanh 数据来源:互联网公开数据 标签:情感分析,自然语言处理,越南语,数据集,文本分类,机器学习,社交媒体,观点挖掘 数据概述: 该数据集包含越南语文本,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录时间跨度未知,但主要反映了越南语社交媒体和评论中常见的情感表达。... -
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,深度学习,IMDB 数据概述:... -
最后生还者系列游戏评论数据集-2011至2023-lazaro97
最后生还者系列游戏评论数据集-2011至2023-lazaro97 数据来源:互联网公开数据 标签:视频游戏,评论,游戏评价,玩家反馈,游戏分析,游戏批评,数据挖掘,文本分类,自然语言处理 数据概述:... -
共同基金用户咨询问题分类数据集-aloktantrik
共同基金用户咨询问题分类数据集-aloktantrik 数据来源:互联网公开数据 标签:共同基金,用户咨询,文本分类,自然语言处理,金融科技,数据分析,机器学习,NLP 数据概述:... -
医疗技术自然语言推理数据集MedTechSNLI50kDataset-mohamedihebhergli
医疗技术自然语言推理数据集MedTechSNLI50kDataset-mohamedihebhergli 数据来源:互联网公开数据 标签:医疗技术,自然语言推理,数据集,NLP,机器学习,文本分类,人工智能,医学研究 数据概述: 该数据集包含来自医疗技术领域的自然语言推理数据,记录了大量的医疗文本及其推理关系。主要特征如下:... -
波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151
波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,语言学,情感挖掘,波斯语 数据概述:... -
基于T5数据增强的人机交互聊天消息数据集-birdy654
基于T5数据增强的人机交互聊天消息数据集-birdy654 数据来源:互联网公开数据 标签:人机交互,聊天消息,T5,数据增强,文本分类,人工智能,研究数据 数据概述:... -
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:... -
僧伽罗语新闻标题数据集-nawarathnadeshan
僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。... -
多标签文本分类数据集-bimleshkumar759
多标签文本分类数据集-bimleshkumar759 数据来源:互联网公开数据 标签:文本分类,多标签,数据集,机器学习,自然语言处理,文本分析,深度学习,NLP 数据概述: 该数据集包含用于多标签文本分类任务的文本数据。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始数据来源。 地理范围: 数据覆盖范围不固定,取决于原始数据来源。... -
土耳其语IMDB电影评论情感分析数据集-yusufgoktas
土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源:互联网公开数据 标签:情感分析,土耳其语,电影评论,自然语言处理,文本分类,机器学习,NLP,土耳其 数据概述: 该数据集包含了来自互联网电影数据库(IMDB)的土耳其语电影评论数据,用于情感分析任务。主要特征如下:... -
多语言自然语言推理与跨语言推理数据集
多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-... -
新闻文本分类数据集-priyabratapanda
新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...