-
尼日利亚政治新闻真伪鉴别数据集-nevilmaloba
尼日利亚政治新闻真伪鉴别数据集-nevilmaloba 数据来源:互联网公开数据 标签:政治新闻,虚假新闻,尼日利亚,数据集,文本分析,自然语言处理,信息真实性,新闻分类 数据概述: 该数据集包含了来自尼日利亚的政治新闻,旨在用于研究和分析新闻的真伪。主要特征如下: 时间跨度:数据记录的时间范围为特定时期内。 地理范围:数据主要来源于尼日利亚。... -
IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha
IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分析,分类算法,人工智能... -
领域分类数据集DomainDatasetCls-nguyncboa
领域分类数据集DomainDatasetCls-nguyncboa 数据来源:互联网公开数据 标签:分类,数据集,机器学习,文本分析,自然语言处理,领域识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个领域的文本数据,主要记录了不同领域的文本样本及其对应的分类标签。主要特征如下:... -
预训练RoBERTa-base模型预测结果数据集-mathislucka
预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:... -
突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi
突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:... -
法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari
法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:... -
聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509
聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509 数据来源:互联网公开数据 标签:文本分析,数据集,聚类分析,自然语言处理,机器学习,文本挖掘,数据分析,人工智能 数据概述:该数据集包含通过聚类算法处理后生成的句子数据,记录了不同类别或主题的文本句子。主要特征如下:... -
推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod
推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,文本分类 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关信息。主要特征如下:... -
计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore
计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore 数据来源:互联网公开数据 标签:计算语言学,语音学,数据集,学术研究,自然语言处理,文本分析,机器学习,学术论文 数据概述:... -
新冠疫情下医疗伦理研究文本数据集-2020-ayan78
新冠疫情下医疗伦理研究文本数据集-2020-ayan78 数据来源:互联网公开数据 标签:新冠疫情,医疗伦理,文本分析,多标签分类,伦理学,医学,数据集,COVID-19,道德,研究 数据概述: 本数据集旨在为新冠疫情背景下的医疗伦理研究提供训练数据。数据集由Ayan... -
Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar
Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar 数据来源:互联网公开数据 标签:新闻事实核查,数据集,信息真实性,新闻分析,机器学习,自然语言处理,媒体研究,文本分析 数据概述: 该数据集包含来自印尼Kompas新闻网站的事实核查数据,记录了新闻内容的真实性核查结果。主要特征如下:... -
语言翻译数据集LanguageTranslationDataset-rohitwaldekar
语言翻译数据集LanguageTranslationDataset-rohitwaldekar 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,文本分析,多语言,人工智能,数据挖掘 数据概述: 该数据集包含来自多个语言翻译项目的数据,记录了不同语言之间的文本翻译对。主要特征如下:... -
关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116
关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,文本分析,数据集,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含来自多个公开来源的文本数据,专注于关键词提取和文本分析任务。主要特征如下:... -
肯尼亚摩托出租车推特数据BodaBodaMenaceinKenyaFilteredTweets数据集-marthamwaura
肯尼亚摩托出租车推特数据BodaBodaMenaceinKenyaFilteredTweets数据集-marthamwaura 数据来源:互联网公开数据 标签:推特数据,社交媒体,肯尼亚,摩托出租车,社会问题,文本分析,自然语言处理,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了关于肯尼亚摩托出租车(Boda... -
图书销量与评论数据集BooksSalesandReviewsDataset-cucudas
图书销量与评论数据集BooksSalesandReviewsDataset-cucudas 数据来源:互联网公开数据 标签:图书,销量,评论,数据集,文本分析,自然语言处理,推荐系统,市场分析 数据概述: 该数据集包含来自互联网的图书销售和评论数据,记录了图书的销售情况,用户评论以及相关信息。主要特征如下: 时间跨度:... -
孟加拉语命名实体识别数据集-koushikdeb
孟加拉语命名实体识别数据集-koushikdeb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,孟加拉语,数据集,语言学,文本分析,机器学习,NLP 数据概述: 该数据集包含孟加拉语文本,用于命名实体识别(NER)任务。主要特征如下: 时间跨度: 数据集未明确时间范围,但涵盖了不同年代和主题的文本。 地理范围:... -
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:... -
俄罗斯与乌克兰战争推文数据集Russia-UkraineWarTweetsDataset-vivekdhir
俄罗斯与乌克兰战争推文数据集Russia-UkraineWarTweetsDataset-vivekdhir 数据来源:互联网公开数据 标签:社交媒体,战争,数据集,文本分析,情感分析,舆情监测,机器学习,国际关系 数据概述: 该数据集包含来自Twitter平台的数据,记录了关于俄罗斯与乌克兰战争的推文内容。主要特征如下:... -
文本评论数据分析数据集ReviewDataTextDataset-asjad2024
文本评论数据分析数据集ReviewDataTextDataset-asjad2024 数据来源:互联网公开数据 标签:文本分析,数据集,评论数据,情感分析,自然语言处理,机器学习,市场研究,消费者行为 数据概述: 该数据集包含来自互联网公开平台的文本评论数据,记录了用户对产品,服务或内容的多维度评价。主要特征如下:... -
数据2018年世界杯推特评论数据集2018WorldCupTweetDataset-starkxu
2018年世界杯推特评论数据集2018WorldCupTweetDataset-starkxu 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,体育赛事,世界杯,舆情监测 数据概述: 该数据集包含来自2018年足球世界杯期间的用户推文,记录了全球用户对赛事的实时评论和讨论。主要特征如下:...