-
主动学习信息检索数据集ActiveLearningInformationRetrievalDataset-divyadarapuneni
主动学习信息检索数据集ActiveLearningInformationRetrievalDataset-divyadarapuneni 数据来源:互联网公开数据 标签:主动学习,信息检索,数据集,文本分类,机器学习,自然语言处理,算法评估,学术研究 数据概述: 该数据集包含用于主动学习在信息检索领域中的应用的数据。主要特征如下: 时间跨度:... -
大规模商品标签数据集BigLabel1Dataset-mohamedtaherbenyemna
大规模商品标签数据集BigLabel1Dataset-mohamedtaherbenyemna 数据来源:互联网公开数据 标签:商品标签,大规模,数据集,文本分类,自然语言处理,机器学习,电商,数据挖掘 数据概述: 该数据集包含了大规模的商品标签数据,旨在为商品文本分类、标签预测等任务提供支持。主要特征如下: 时间跨度:数据记录的时间范围为当前。... -
金融监管文本分类数据集FinancialRegulatoryTextClassificationDataset-atharvaingle
金融监管文本分类数据集FinancialRegulatoryTextClassificationDataset-atharvaingle 数据来源:互联网公开数据 标签:金融监管, 文本分类, 自然语言处理, 法律文本, 监管文件, 机器学习, 多标签分类, 风险管理 数据概述:... -
科技写作质量评估训练数据集TechnologyWritingQualityAssessmentTrainingDataset-laurensprast
科技写作质量评估训练数据集TechnologyWritingQualityAssessmentTrainingDataset-laurensprast 数据来源:互联网公开数据 标签:写作质量评估, 文本分类, 机器学习, 自然语言处理, 科技写作, 情感分析, 文本生成, 数据标注 数据概述:... -
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream 数据来源:互联网公开数据 标签:自然语言处理,文本分类,ai生成,人类写作,机器学习,文本分析,语言模型,数据挖掘 数据概述:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 社交媒体, 自然语言处理, 情感分析, 政治言论, 恶意内容, 语料库 数据概述:... -
新闻主题分类数据集-lysatrf
新闻主题分类数据集-lysatrf 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,新闻,机器学习,主题建模,舆情分析,信息检索 数据概述:该数据集包含来自新闻网站的文章数据,记录了新闻文章的内容及其对应的主题分类。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了近期的新闻文章。... -
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:... -
Yelp用户评论负样本数据集-che011
Yelp用户评论负样本数据集-che011 数据来源:互联网公开数据 标签:用户评论,负样本,情感分析,自然语言处理,数据集,机器学习,文本分类,Yelp 数据概述:该数据集包含来自Yelp平台的负样本用户评论数据,主要用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了Yelp平台上较早期的用户评论。... -
多领域语义匹配数据集MSMARCOModifiedDataset-n068968
多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:... -
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 问答系统, 语义分析, 文本分类, 机器学习, 深度学习, 数据标注 数据概述:... -
虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha
虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha 数据来源:互联网公开数据 标签:虚假新闻,事实核查,自然语言处理,文本分类,机器学习,新闻分析,舆情分析,社会科学 数据概述: 该数据集包含来自PolitiFact网站的虚假新闻和事实核查数据,用于训练和评估虚假新闻检测模型。主要特征如下:... -
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻文章, 文本分类, 土耳其语, 内容分析, 类别识别, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自土耳其TRT... -
词嵌入情感分析数据集D2VSentimentDataset-magomago
词嵌入情感分析数据集D2VSentimentDataset-magomago 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词嵌入,深度学习,文本分类,机器学习,情感词典 数据概述: 该数据集包含用于情感分析任务的文本数据,结合了分布式词向量(Doc2Vec)技术,旨在研究和评估文本情感的表达和识别。主要特征如下: 时间跨度:... -
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar 数据来源:互联网公开数据 标签:虚假评论,数据集,自然语言处理,文本分类,机器学习,电商分析,情感分析,数据挖掘 数据概述: 该数据集包含来自电商平台或社交媒体的评论数据,记录了用户对产品或服务的评价内容及其真实性标签。主要特征如下:... -
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 嵌入向量, 深度学习, 自然语言处理, 模型训练, 情感分析, 机器学习 数据概述: 该数据集包含用于训练和评估文本毒性分类模型的嵌入向量数据。主要特征如下:... -
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw... -
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl 数据来源:互联网公开数据 标签:疫情, 微博, 情感分析, 自然语言处理, 文本分类, 社交媒体, 情感倾向, 中文文本 数据概述:...