-
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
-
乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz
乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz 数据来源:互联网公开数据 标签:新闻文本,文本分类,乌尔都语,数据集,自然语言处理,机器学习,语言技术,信息提取 数据概述:...
-
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
-
新闻深度处理数据集NewsDeepProcessedDataset-mario123475
新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:...
-
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:...
-
网页内容与词法特征提取数据集2022年-vanshhagrawal
网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:...
-
AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii
AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:...
-
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
-
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
-
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
-
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:...
-
最终内容数据集FinalContentDataset-akash1vishwakarma
最终内容数据集FinalContentDataset-akash1vishwakarma 数据来源:互联网公开数据 标签:内容分析,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息提取,知识管理 数据概述:该数据集包含来自多个来源的内容数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
-
丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m
丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m 数据来源:互联网公开数据 标签:新闻数据,数据采集,数据集,文本分析,自然语言处理,机器学习,信息提取,数据挖掘 数据概述: 该数据集包含来自越南丹特里新闻网站(Dantri)的数据,记录了该网站的新闻文章内容。主要特征如下:...
-
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh 数据来源:互联网公开数据 标签:灾害管理,社交网络,数据集,文本分析,机器学习,自然语言处理,危机响应,信息提取 数据概述:该数据集包含预处理过的推文数据,这些推文与自然灾害事件相关。主要特征如下:...
-
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:...
-
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45 数据来源:互联网公开数据 标签:文本分析,数据提取,自然语言处理,机器学习,数据集,信息提取,文本挖掘,情感分析 数据概述:该数据集包含来自黑科弗公司的数据,专注于文本数据的提取和分析。主要特征如下:...
-
预处理推文数据集PreprocessedTweetsDataset-dv1453
预处理推文数据集PreprocessedTweetsDataset-dv1453 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,信息提取 数据概述: 该数据集包含来自社交媒体平台预处理后的推文数据,记录了用户发布的推文文本及相关信息。主要特征如下:...
-
自然语言处理NLP最终项目数据集-prasadmagdum
自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。...
-
新闻摘要数据集NewsSummaryDataset-usmannwaheed
新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。...
-
推特新训练集TweetNewTrainFolds-zzy990106
推特新训练集TweetNewTrainFolds-zzy990106 数据来源:互联网公开数据 标签:推特数据,数据集,文本分析,机器学习,自然语言处理,社交媒体分析,情感分析,信息提取 数据概述:该数据集包含来自推特的新训练数据,记录了大量推文以供文本分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...



