-
文本分类数据集SISTextClassificationDataset-senylar
文本分类数据集SISTextClassificationDataset-senylar 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息检索,人工智能 数据概述: 该数据集为SIS项目的一部分,主要包含用于文本分类任务的文本数据。主要特征如下:... -
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:... -
数据2020年Shopee代码联赛情感分析数据集-rareloto
2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:... -
BotezLive直播聊天记录分类数据集-brandonbenton
BotezLive直播聊天记录分类数据集-brandonbenton 数据来源:互联网公开数据 标签:直播聊天,文本分类,数据集,机器学习,自然语言处理,游戏直播,社区互动,情感分析 数据概述: 该数据集包含了 BotezLive 直播平台的聊天记录,旨在用于文本分类和情感分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了... -
电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate
电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, 深度学习, 文本分类, 数据集, 机器学习, PyTorch模型 数据概述:... -
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:... -
自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater
自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,机器翻译,项目复现 数据概述: 该数据集旨在为自然语言处理(NLP)项目复现提供数据支持,包含多种文本类型和任务的数据集。主要特征如下: 时间跨度:... -
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 情感分析, 机器学习, 自然语言处理, 深度学习, 数据标注 数据概述: 该数据集包含来自在线评论平台的数据,记录了用户发布的评论文本及其对应的毒性标签。主要特征如下:... -
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost 数据来源:互联网公开数据 标签:新闻数据集,预处理,自然语言处理,机器学习,文本分析,Roberta模型,文本分类,情感分析 数据概述:... -
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文文本, 情感极性, 自然语言处理, 机器学习, 情感标注, 数据集 数据概述: 该数据集包含来自互联网的中文文本数据,记录了文本内容及其对应的情感极性。主要特征如下:... -
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers 数据来源:互联网公开数据 标签:法律,文档检索,数据集,信息检索,自然语言处理,文本分类,法律科技,机器学习 数据概述: 该数据集包含来自德国联邦刑事警察局(BKA)的法律文档检索数据,记录了法律文档的检索和分类信息。主要特征如下:... -
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 自然语言处理, 机器学习, 情感分析, 社交媒体, 语料库 数据概述:... -
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332 数据来源:互联网公开数据 标签:文本分析, 写作评估, 机器学习, 自然语言处理, 情感分析, 文本分类, 教育, 语料库 数据概述: 该数据集包含来自不同来源的学生写作文章,旨在用于评估学生的写作质量。主要特征如下:... -
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo 数据来源:互联网公开数据 标签:仇恨言论, 攻击性内容, 文本分析, 情感分析, 社交媒体, 文本分类, 自然语言处理, 数据标注 数据概述:... -
商品标题分类数据集ProductTitleCategorizationDataset-nelsonjavier
商品标题分类数据集ProductTitleCategorizationDataset-nelsonjavier 数据来源:互联网公开数据 标签:商品分类, 文本分类, 标题分析, 零售, 类别预测, 数据标注, 机器学习, 商品推荐 数据概述: 该数据集包含来自电商平台或商品目录的商品标题数据,记录了商品标题文本与其对应的商品类别。主要特征如下:... -
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,文本分类,自然语言处理,机器学习,舆情分析,社交媒体,信息真伪 数据概述: 该数据集整合了多个来源的虚假新闻数据,旨在为研究人员提供一个全面的、用于虚假新闻检测和分析的资源。主要特征如下:... -
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu 数据来源:互联网公开数据 标签:音乐风格,歌词分析,数据集,机器学习,文本分类,多语言,自然语言处理,数据挖掘 数据概述: 该数据集包含来自多种语言的歌曲歌词,主要用于音乐风格分类任务。主要特征如下:... -
通用语料库数据集CorpusDataset-cthitrn
通用语料库数据集CorpusDataset-cthitrn 数据来源:互联网公开数据 标签:语料库,自然语言处理,数据集,文本分析,机器学习,数据挖掘,语言模型,文本分类 数据概述: 该数据集包含来自多种来源的文本数据,记录了不同领域的语言表达。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung 数据来源:互联网公开数据 标签:情感分析, 产品评论, 文本分类, 情感极性, 机器学习, 自然语言处理, 用户反馈, 数据集 数据概述:...