-
最终清洗数据集-自然语言处理与情感分类场景
最终清洗数据集-自然语言处理与情感分类场景 数据来源:互联网公开数据 标签:NLP,情感分类,数据清洗,文本分析,机器学习,数据集 数据概述: 本数据集经过最终清洗处理,适用于建模和各种自然语言处理(NLP)任务。数据包含经过预处理的文本信息,适用于情感分类等应用场景。数据集已经完成了必要的清理步骤,确保数据质量和一致性。 数据用途概述:...
-
-
数据2020年美国大选推文数据集
数据2020年美国大选推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,情感分析,选举,政治,NLP,文本挖掘,舆论分析,数据科学 数据概述: 本数据集包含了2020年美国大选前两周(10月18日至11月1日)收集的439,999条推文,数据通过Twitter API和Tweepy...
-
MLQA多语言问答数据集2021-thedevastator
MLQA多语言问答数据集2021-thedevastator 数据来源:互联网公开数据 标签:多语言,问答系统,NLP,机器学习,数据集,公开数据,模型评估,跨语言学习 数据概述:...
-
TripAdvisor旅行评论数据集-用于NLP任务-2021
TripAdvisor旅行评论数据集-用于NLP任务-2021 数据来源:互联网公开数据 标签:TripAdvisor,旅行评论,自然语言处理,NLP,数据分析,机器学习,情感分析,个性化推荐,文本摘要 数据概述:...
-
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:...
-
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl 数据来源:互联网公开数据 标签:越南语,情感分析,社交媒体,数据集,自然语言处理,文本分析,机器学习,NLP 数据概述: 该数据集包含了来自越南社交媒体平台的用户文本数据,主要用于情感分析任务。主要特征如下:...
-
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:...
-
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,情感分析,恶意评论,数据集,社交媒体,NLP 数据概述: 该数据集由 Jigsaw 团队提供,旨在用于检测在线评论中的恶意、侮辱性和攻击性言论。主要特征如下:...
-
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:...
-
推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch
推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,自然语言处理,机器学习,文本分析,舆情分析,NLP 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要用于情感分析研究。主要特征如下:...
-
Alura词向量数据集AluraWord2VecDataset-romariogomesbr
Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
-
自然语言处理NLP职位描述数据集-koti4878m
自然语言处理NLP职位描述数据集-koti4878m 数据来源:互联网公开数据 标签:自然语言处理,NLP,职位描述,文本分析,机器学习,招聘,数据挖掘,文本分类 数据概述:该数据集包含来自互联网的职位描述文本数据,主要记录了不同行业的职位描述信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不定,取决于爬取时间与数据来源。...
-
标题:文本标题提取数据集(Hasninasri Title Extraction Dataset)
标题:文本标题提取数据集(Hasninasri Title Extraction Dataset) 数据来源:互联网公开数据 标签:文本分析,标题提取,自然语言处理,机器学习,文本挖掘,NLP,数据集,信息检索 数据概述: 该数据集由Hasninasri提供,旨在用于文本标题的提取和生成任务,包含大量的文本内容及其对应的标题。主要特征如下:...
-
诗歌创作与分析数据集PoemsData-lisaameliewittmann
诗歌创作与分析数据集PoemsData-lisaameliewittmann 数据来源:互联网公开数据 标签:诗歌,数据集,自然语言处理,文本分析,情感分析,文学研究,创作,NLP 数据概述: 该数据集包含了来自互联网的各类诗歌作品,旨在为诗歌创作与分析提供数据支持。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了从古代到现代的诗歌作品。...
-
Synnax数据集竞赛第二期数据集-sukrucildirr
Synnax数据集竞赛第二期数据集-sukrucildirr 数据来源:互联网公开数据 标签:机器学习,数据集,自然语言处理,文本分类,情感分析,竞赛,中文文本,NLP 数据概述: 该数据集是 Synnax 数据集竞赛第二期提供的数据集,主要用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但为竞赛提供,具有时效性。...
-
阿拉伯语文本情感分析数据集-nanorfelixsam
阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。...
-
阿拉伯新闻文章标题生成数据集-oussamaseffai
阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。...
-
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,机器翻译,数据集,文本分析,NLP 数据概述: 该数据集包含来自CNN新闻的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了新闻发布的时间段,具体时间范围未明确。...
-
词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju
词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,语义分析,向量空间,NLP 数据概述: 该数据集包含了使用Word2Vec模型训练得到的词向量结果,主要记录了词汇与其对应的向量表示。主要特征如下:...



