-
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:... -
Yelp评论数据科学与训练营数据集YelpReviewsDataScienceBootcampDataset-jordansiem
Yelp评论数据科学与训练营数据集YelpReviewsDataScienceBootcampDataset-jordansiem 数据来源:互联网公开数据 标签:数据科学,评论分析,数据集,机器学习,情感分析,自然语言处理,商业智能,教育培训 数据概述: 该数据集包含来自Yelp平台的用户评论数据,记录了用户对各种商业服务的评价和反馈。主要特征如下:... -
虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo
虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,新闻传播,社会研究 数据概述: 该数据集包含经过预处理的虚假新闻数据,记录了不同来源的虚假新闻文章及其相关信息。主要特征如下:... -
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,语音识别,智能问答,人工智能,航空服务 数据概述:... -
电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010
电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010 数据来源:互联网公开数据 标签:情感分析,文本分类,电影评论,自然语言处理,机器学习,IMDB,二元分类,情感极性,影评,评论 数据概述: 本数据集是IMDB(互联网电影数据库)提供的大规模影评数据集,专门用于二元情感分类任务。... -
康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty
康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本挖掘,语义理解,机器学习,情感计算 数据概述: 该数据集包含来自康奈尔大学收集的电影评论文本数据,记录了用户对电影的评价和情感倾向。主要特征如下:... -
植物病害诊断对话数据集-rahulrwl
植物病害诊断对话数据集-rahulrwl 数据来源:互联网公开数据 标签:植物病害,诊断,对话,自然语言处理,机器学习,农业,疾病识别,文本分析 数据概述: 该数据集包含植物病害诊断相关的对话记录,记录了用户与诊断系统之间的互动。主要特征如下: 时间跨度: 数据记录的时间范围为不确定,取决于对话的收集时间。 地理范围:... -
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:... -
微软语音识别挑战赛MicrosoftSpeechRecognitionCompetition数据集MicrosoftSpeechRecognitionCo...
微软语音识别挑战赛MicrosoftSpeechRecognitionCompetition数据集MicrosoftSpeechRecognitionCompetitionDataset-caramelapple 数据来源:互联网公开数据 标签:语音识别,数据集,自然语言处理,人工智能,机器学习,声音分析,信号处理,计算机科学... -
虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222
虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息检测,机器学习,文本分类,自然语言处理,信息安全,社会研究 数据概述: 该数据集包含来自互联网的真实新闻与虚假新闻数据,记录了新闻文本及相关特征,用于虚假新闻的识别与预测。主要特征如下:... -
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:... -
负面评论数据集NegativeCommentsDataset-yuzhe2020
负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:... -
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai 数据来源:互联网公开数据 标签:多语言问答,印地语,数据集,自然语言处理,机器学习,文本分析,问答系统,语言技术 数据概述: 该数据集包含来自多语言问答系统(MLQA)的印地语数据,记录了包含问题和对应答案的问答对。主要特征如下:... -
Shopee用户评论数据集-alvianardiansyah
Shopee用户评论数据集-alvianardiansyah 数据来源:互联网公开数据 标签:电商平台,用户评论,情感分析,文本挖掘,机器学习,自然语言处理,市场调研,消费者行为 数据概述: 该数据集包含来自Shopee电商平台的用户评论数据,记录了用户对商品和服务的评价。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据采集的范围。... -
大型语言模型LLM考试数据集-baorbaor
大型语言模型LLM考试数据集-baorbaor 数据来源:互联网公开数据 标签:大型语言模型,LLM,考试,评估,自然语言处理,人工智能,NLP,机器学习 数据概述: 该数据集包含用于评估大型语言模型(LLM)在考试场景中的表现的数据。主要特征如下: 时间跨度:数据记录的时间范围为当前,持续更新。... -
法律文章分析数据集LegalArticlesDataset-saidgrich
法律文章分析数据集LegalArticlesDataset-saidgrich 数据来源:互联网公开数据 标签:法律文章,数据集,文本分析,法学研究,自然语言处理,法律咨询,法律知识,法律教育 数据概述: 该数据集包含来自多个法律网站和法律数据库的法律文章数据,记录了各类法律文件,案例分析和法律评论等详细信息。主要特征如下:... -
阅读量统计数据集ReadsCountDataset-sumbalwahid
阅读量统计数据集ReadsCountDataset-sumbalwahid 数据来源:互联网公开数据 标签:阅读量,统计,数据集,新闻,文章,用户行为,数据分析,自然语言处理 数据概述:该数据集包含来自新闻网站的文章阅读量统计数据,记录了文章的阅读次数,用户行为等信息。主要特征如下:... -
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3 数据来源:互联网公开数据 标签:情感分析,用户评论,数据集,自然语言处理,机器学习,文本分析,市场研究,客户反馈 数据概述:... -
词汇与人类特征分析数据集
标题:词汇与人类特征分析数据集 数据内容: 本数据集包含三个主要字段: 1. Word 1:包含206种不同的词汇值,代表一组特定的词语或短语。 2. Word 2:包含295种不同的词汇值,代表另一组特定的词语或短语。 3. Human (Mean):包含146种不同的值,代表与人类相关的某种特征或指标,可能是某种测量或分类结果。 数据来源:... -
大规模语音识别乱序数据集LargeASRShuffleDataset-gamingnation
大规模语音识别乱序数据集LargeASRShuffleDataset-gamingnation 数据来源:互联网公开数据 标签:语音识别,数据集,机器学习,自然语言处理,人工智能,语音技术,音频处理,深度学习 数据概述: 该数据集包含大规模的语音识别数据,记录了不同场景下的语音音频和对应的文本转录。主要特征如下:...