-
基于LLM的深度伪造文本检测数据集-dileepjayamal
基于LLM的深度伪造文本检测数据集-dileepjayamal 数据来源:互联网公开数据 标签:LLM,深度伪造,文本检测,数据集,自然语言处理,机器学习,人工智能,文本分析 数据概述: 该数据集包含了由大型语言模型(LLM)生成的深度伪造文本,旨在用于检测和识别这些虚假文本。主要特征如下:... -
电影评论数据集MovieCriticismDataset-mrriandmstique
电影评论数据集MovieCriticismDataset-mrriandmstique 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,情感分析,自然语言处理,电影研究,文化研究,社会学 数据概述:该数据集包含来自互联网公开资源的电影评论数据,记录了各类电影的评论内容及评分信息。主要特征如下:... -
文本分类新闻数据集TextClassificationNewsDataset-balatmak
文本分类新闻数据集TextClassificationNewsDataset-balatmak 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 语料库, 多分类, 机器学习, 文本挖掘, 信息检索 数据概述: 该数据集包含来自不同新闻来源的文本数据,记录了新闻文章的内容及其所属类别,适用于文本分类、信息检索等任务。主要特征如下:... -
商品评论情感分析增强数据集ProductReviewSentimentAnalysisAugmentationDataset-indralin
商品评论情感分析增强数据集ProductReviewSentimentAnalysisAugmentationDataset-indralin 数据来源:互联网公开数据 标签:情感分析, 评论数据, 文本增强, 机器学习, 自然语言处理, 文本分类, 数据集, 情感标注 数据概述:... -
量子电路摘要生成数据集QuantumCircuitSummarization-mridul3301
量子电路摘要生成数据集QuantumCircuitSummarization-mridul3301 数据来源:互联网公开数据 标签:量子计算, 文本摘要, 自然语言处理, 机器翻译, 科技文献, 深度学习, 数据集构建, 摘要生成 数据概述: 该数据集包含来自学术论文的数据,记录了量子电路领域的相关研究内容,并提供了对应的摘要。主要特征如下:... -
文本情感分析训练数据集TextSentimentAnalysisTrainingDataset-nvab19
文本情感分析训练数据集TextSentimentAnalysisTrainingDataset-nvab19 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 机器学习, 数据预处理, 语料库, 文本挖掘 数据概述: 该数据集包含来自公开论坛的文本数据,记录了用于情感分析任务的文本样本。主要特征如下:... -
文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138
文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138 数据来源:互联网公开数据 标签:主题建模, 文本分析, 动态主题, 时间序列分析, 词频统计, 文本挖掘, 自然语言处理, 数据可视化 数据概述: 该数据集包含从未知来源收集的文本数据,并经过处理,用于研究文本主题随时间的变化。主要特征如下:... -
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:... -
政治人物推文分析数据集PoliticalFiguresTweetsAnalysis-ensamblador
政治人物推文分析数据集PoliticalFiguresTweetsAnalysis-ensamblador 数据来源:互联网公开数据 标签:推文分析, 社交媒体, 政治人物, 文本挖掘, 情感分析, 舆情分析, Twitter数据, 自然语言处理 数据概述:... -
多模态医学影像报告生成数据集MultimodalMedicalImagingReportGenerationDataset-sairaamvenkataraman
多模态医学影像报告生成数据集MultimodalMedicalImagingReportGenerationDataset-sairaamvenkataraman 数据来源:互联网公开数据 标签:医学影像, 报告生成, 多模态, 深度学习, 自然语言处理, 影像组学, 临床诊断, 数据标注 数据概述:... -
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集 数据概述:... -
文本预测模型训练数据集TextPredictionModelTrainingDataset-harshityadav95
文本预测模型训练数据集TextPredictionModelTrainingDataset-harshityadav95 数据来源:互联网公开数据 标签:文本预测, 自然语言处理, 词嵌入, 机器学习, 预测模型, 语料库, 数据分析, 深度学习 数据概述: 该数据集包含用于训练文本预测模型的数据,记录了上下文词语与预测词之间的关系。主要特征如下:... -
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj 数据来源:互联网公开数据 标签:维基文库,标题,草稿,文本分析,自然语言处理,数据集,中文,语料库 数据概述: 该数据集包含来自维基文库(ZhWikiSource)的标题草稿数据,记录了维基文库中标题草稿的详细信息。主要特征如下:... -
基因变异与癌症文本分类数据集GeneVariationandCancerTextClassification-pushkinarora098
基因变异与癌症文本分类数据集GeneVariationandCancerTextClassification-pushkinarora098 数据来源:互联网公开数据 标签:基因变异, 癌症, 文本分类, 基因组学, 生物医学, 机器学习, 自然语言处理, 临床研究 数据概述:... -
Shopee平台商品评论数据集ShopeeReviewsDataset-shymammoth
Shopee平台商品评论数据集ShopeeReviewsDataset-shymammoth 数据来源:互联网公开数据 标签:电商平台,商品评论,数据集,自然语言处理,用户评价,市场分析,消费者行为,电子商务 数据概述: 该数据集包含来自Shopee平台的商品评论数据,记录了用户对商品的评价和反馈。主要特征如下:... -
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源:互联网公开数据 标签:文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建 数据概述:... -
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:... -
电子产品用户评价数据集ElectronicsItemRatingsDataset-bishnusaransahu
电子产品用户评价数据集ElectronicsItemRatingsDataset-bishnusaransahu 数据来源:互联网公开数据 标签:电子产品,用户评价,数据集,情感分析,推荐系统,自然语言处理,机器学习,消费者行为 数据概述: 该数据集包含了来自多个电子产品用户评价的数据,记录了用户对不同电子产品的评价信息。主要特征如下:... -
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:... -
垃圾邮件识别与电影评论情感分析数据集SpamDetection-MovieReviewSentimentAnalysisDataset-eurekaarrow
垃圾邮件识别与电影评论情感分析数据集SpamDetection-MovieReviewSentimentAnalysisDataset-eurekaarrow 数据来源:互联网公开数据 标签:垃圾邮件, 情感分析, 文本分类, 自然语言处理, 机器学习, 电影评论, 文本预处理, 语料库 数据概述:...