-
自然语言处理与情感分析数据集NLP-4-5M-Clean-SentencesDataset-amardura
自然语言处理与情感分析数据集NLP-4-5M-Clean-SentencesDataset-amardura 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,数据挖掘,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的清洗后的句子数据,记录了用于自然语言处理和情感分析任务的高质量文本内容。主要特征如下:... -
安然公司邮件主题分类数据集EnronEmailSubjectClassificationDataset-kadasingh
安然公司邮件主题分类数据集EnronEmailSubjectClassificationDataset-kadasingh 数据来源:互联网公开数据 标签:邮件数据, 文本分类, 自然语言处理, 情感分析, 邮件主题, 数据挖掘, 商业邮件, Enron 数据概述:... -
新闻文本真伪性评估数据集NewsTextTruthfulnessAssessmentDataset-akshaynarayananb
新闻文本真伪性评估数据集NewsTextTruthfulnessAssessmentDataset-akshaynarayananb 数据来源:互联网公开数据 标签:新闻真伪, 文本分类, 事实核查, 情感分析, 舆情分析, 自然语言处理, 机器学习, 文本标注 数据概述:... -
Zalo人工智能公开测试数据集-gigggggge
Zalo人工智能公开测试数据集-gigggggge 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,情感分析,机器学习,语义理解,Zalo 数据概述: 该数据集包含来自Zalo人工智能公开测试的数据,主要用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但反映了Zalo人工智能系统在特定时间段内的表现。... -
土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia
土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 自然语言处理, 土耳其语, 舆情分析, 关键词提取, 政治新闻, 深度学习 数据概述:... -
学术论文文本分类数据集AcademicPaperTextClassification-qwenzo
学术论文文本分类数据集AcademicPaperTextClassification-qwenzo 数据来源:互联网公开数据 标签:文本分类, 学术论文, 自然语言处理, 机器学习, 论文摘要, 论文标题, 论文结构, Scigen 数据概述: 该数据集包含来自互联网的学术论文数据,记录了论文的标题、摘要、引言、结论以及分类标签。主要特征如下:... -
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 多语言, 自然语言处理, 情感分析, 语言模型, 文本清洗, 机器学习 数据概述:... -
信息检索与机器阅读理解数据集MSMARCODataset-parthplc
信息检索与机器阅读理解数据集MSMARCODataset-parthplc 数据来源:互联网公开数据 标签:信息检索,机器阅读理解,数据集,自然语言处理,搜索技术,人工智能,深度学习,文本分类 数据概述: 该数据集由微软(Microsoft)发布,主要记录了面向大规模信息检索和机器阅读理解任务的数据。主要特征如下:... -
Jigsaw毒性评论分类训练数据集JigsawToxicCommentClassificationTrainDataset-zaheenchoudhry
Jigsaw毒性评论分类训练数据集JigsawToxicCommentClassificationTrainDataset-zaheenchoudhry 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,自然语言处理,文本分类,社会分析,毒性评论,数据预处理 数据概述:该数据集由 Jigsaw... -
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻, 自然语言处理, 深度学习, 语料库, 情感标签, 预训练 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻文章的描述信息及其对应的情感类别。主要特征如下:... -
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007 数据来源:互联网公开数据 标签:跨语言, 文本理解, 多任务学习, 机器翻译, 文本分类, 问答系统, 数据集, 自然语言处理 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-brij1823
新闻文本分类数据集NewsTextClassificationDataset-brij1823 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 标题分析, 自然语言处理, 新闻内容, 时间序列, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻标题及其对应的类别。主要特征如下:... -
新闻文章文本情感分析数据集NewsArticleTextSentimentAnalysis-vangphamhuu
新闻文章文本情感分析数据集NewsArticleTextSentimentAnalysis-vangphamhuu 数据来源:互联网公开数据 标签:新闻文章, 情感分析, 文本分类, 自然语言处理, 情感极性, 机器学习, 数据标注, 舆情分析 数据概述: 该数据集包含来自新闻网站的文章文本数据,记录了新闻文章的内容,可用于情感分析任务。主要特征如下:... -
儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi
儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi 数据来源:互联网公开数据 标签:儿童文学, 文本分析, 情感分析, 图神经网络, 文本分类, 机器学习, 自然语言处理, 叙事结构 数据概述:... -
旅游景点评论情感分析数据集TourismSentimentAnalysisofReviews-sourav5720
旅游景点评论情感分析数据集TourismSentimentAnalysisofReviews-sourav5720 数据来源:互联网公开数据 标签:情感分析, 旅游, 评论数据, 自然语言处理, 文本分类, 景点评价, 机器学习, 数据标注 数据概述: 该数据集包含来自旅游景点评论数据,记录了用户对不同景点的评价文本及其对应的情感极性。主要特征如下:... -
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu 数据来源:互联网公开数据 标签:文本分类, 教育, 主题相关性, 自然语言处理, 机器学习, 知识图谱, 语料库, 内容理解 数据概述:... -
问答对重复性判断数据集QuestionPairDuplicateDetectionDataset-aphelionr
问答对重复性判断数据集QuestionPairDuplicateDetectionDataset-aphelionr 数据来源:互联网公开数据 标签:自然语言处理, 文本匹配, 语义相似度, 问答系统, 文本分类, 机器学习, 数据增强, 深度学习 数据概述:... -
文本情感分析数据集TextSentimentAnalysis-zhihaoliang2
文本情感分析数据集TextSentimentAnalysis-zhihaoliang2 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情感极性, 机器学习, 深度学习, 自然语言处理, 情感标注, 文本向量化 数据概述: 该数据集包含用于文本情感分析任务的结构化数据,主要用于训练和评估文本情感分类模型。主要特征如下:... -
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand 数据来源:互联网公开数据 标签: 毒性检测, 文本分类, 机器学习, 情感分析, 自然语言处理, 深度学习, 评论分析, 模型预测 数据概述: 该数据集包含来自社交平台评论的预测结果,用于评估评论的毒性程度。主要特征如下:... -
文档页面分类数据集DocumentPageClassificationDataset-lucigugler
文档页面分类数据集DocumentPageClassificationDataset-lucigugler 数据来源:互联网公开数据 标签:文本分类, 页面识别, 文档分析, 机器学习, 图像处理, 数据标注, 结构化数据, HDF5 数据概述: 该数据集包含用于文档页面分类的数据,记录了文档页面及其对应的分类标签。主要特征如下:...