-
亚马逊健康产品评论数据集AmazonHealthProductReviewsDataset-tarekziad
亚马逊健康产品评论数据集AmazonHealthProductReviewsDataset-tarekziad 数据来源:互联网公开数据 标签:健康产品,用户评论,电子商务,数据集,自然语言处理,情感分析,消费者行为,机器学习 数据概述: 该数据集包含来自亚马逊平台的健康产品用户评论数据,记录了消费者对健康相关产品的评价和反馈。主要特征如下:... -
新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-ahmedeep
新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-ahmedeep 数据来源:互联网公开数据 标签:社交媒体,情感分析,新冠疫情,推文,自然语言处理,文本挖掘,机器学习,公共卫生 数据概述:... -
歌词生成数据集LyricsGenerationDataset-ankitshah30
歌词生成数据集LyricsGenerationDataset-ankitshah30 数据来源:互联网公开数据 标签:歌词生成,数据集,自然语言处理,文本生成,机器学习,音乐分析,文化研究,人工智能 数据概述: 该数据集包含来自多个来源的歌词文本,记录了不同歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 平行语料, 越南语, 西班牙语, 语言学, 自然语言处理, 语料库, 文本对齐 数据概述: 该数据集包含越南语和西班牙语的平行文本对,记录了两种语言的对应翻译示例。主要特征如下:... -
孟加拉语语音识别训练元数据数据集-imtiazprio
孟加拉语语音识别训练元数据数据集-imtiazprio 数据来源:互联网公开数据 标签:语音识别,数据集,孟加拉语,语音数据,自然语言处理,声学模型,机器学习,语言学 数据概述: 该数据集包含孟加拉语语音识别训练的元数据信息,记录了用于训练语音识别模型的相关数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,但通常涵盖了语音识别研究的最新进展。... -
多语言问答与生成数据集MultilingualQuestionAnsweringandGenerationDataset-sajanakhleh
多语言问答与生成数据集MultilingualQuestionAnsweringandGenerationDataset-sajanakhleh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 机器翻译, 数据增强, 文本生成, 语料库, 摘要生成, 多语言 数据概述:... -
文本分类训练验证数据集TextClassificationTrainingandValidationDataset-czc123456
文本分类训练验证数据集TextClassificationTrainingandValidationDataset-czc123456 数据来源:互联网公开数据 标签:文本分类, 机器学习, 数据集, 训练集, 验证集, 标签, 自然语言处理, 深度学习 数据概述:... -
社交平台讽刺性言论识别数据集SocialPlatformSarcasmDetectionDataset-muhammadnaeem065
社交平台讽刺性言论识别数据集SocialPlatformSarcasmDetectionDataset-muhammadnaeem065 数据来源:互联网公开数据 标签:讽刺检测, 文本分类, 自然语言处理, 情感分析, 社交媒体, 语料库, 机器学习, 评论分析 数据概述:... -
语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k
语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k 数据来源:互联网公开数据 标签:语音识别, 语音数据, 文本标注, 声学模型, 自然语言处理, 语音合成, 机器学习, 语料库 数据概述: 该数据集包含来自 Common Voice... -
职业分类与嵌入向量分析数据集OccupationalClassificationandEmbeddingVectorAnalysisDataset-sudhirrd007
职业分类与嵌入向量分析数据集OccupationalClassificationandEmbeddingVectorAnalysisDataset-sudhirrd007 数据来源:互联网公开数据 标签:职业分类, 文本嵌入, 向量分析, 职业编码, 数据挖掘, 自然语言处理, 劳动力市场, 行业研究 数据概述:... -
推特投资者情绪分析数据集TwitterInvestorSentimentAnalysisDataset-dominikgulacsy
推特投资者情绪分析数据集TwitterInvestorSentimentAnalysisDataset-dominikgulacsy 数据来源:互联网公开数据 标签:社交媒体,投资者情绪,数据集,情感分析,机器学习,金融科技,自然语言处理,市场预测 数据概述:... -
Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale
Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale 数据来源:互联网公开数据 标签:社交网络,文本嵌入,数据集,自然语言处理,机器学习,情感分析,用户行为,文本分析 数据概述:... -
文本分词数据集RdrSegmenterZalo数据集-thimkth
文本分词数据集RdrSegmenterZalo数据集-thimkth 数据来源:互联网公开数据 标签:文本分词,数据集,自然语言处理,机器学习,深度学习,语言技术,人工智能 数据概述:该数据集由Zalo团队提供,主要用于训练和评估文本分词模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。... -
YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx
YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx 数据来源:互联网公开数据 标签:自然语言处理,数据集,越南语,文本分析,机器学习,情感分析,社交媒体,多语言处理 数据概述: 该数据集包含来自YouTube平台的越南语评论数据,记录了用户对视频内容的评论信息。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationData-vassostrouthopoulou
新闻文本分类数据集NewsTextClassificationData-vassostrouthopoulou 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 机器学习, 情感分析, 文本挖掘, 数据标注, 舆情分析 数据概述: 该数据集包含来自新闻媒体的文章文本数据,记录了新闻标题、正文内容及其对应的分类标签。主要特征如下:... -
医疗问答数据集RawMedicalQADataset-amirataha
医疗问答数据集RawMedicalQADataset-amirataha 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,机器学习,健康咨询,医学研究,疾病诊断,医疗信息 数据概述:该数据集包含来自公开医疗问答平台的数据,记录了用户提出的问题及其对应的医生回复。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2023年。... -
文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner
文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner 数据来源:互联网公开数据 标签:文本连贯性, 自然语言处理, 伪标签, 文本分析, 机器学习, 文本特征, 语篇分析, 模型预测 数据概述:... -
社交媒体情绪分析ChatGPT相关推文数据集SentimentAnalysisofChatGPTTweets-suryadeepti
社交媒体情绪分析ChatGPT相关推文数据集SentimentAnalysisofChatGPTTweets-suryadeepti 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 自然语言处理, 文本分类, 深度学习, ChatGPT, 舆情分析, 情绪识别 数据概述:... -
问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid
问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid 数据来源:互联网公开数据 标签:问答系统, 文本分析, 质量评估, 机器学习, 自然语言处理, 深度学习, 模型训练, 预测 数据概述: 该数据集包含用于评估问答对质量的结构化数据,主要用于训练和测试问答质量评估模型。主要特征如下:... -
氮氧化物排放与自然语言处理综合研究数据集NitroNLP3Dataset-victorbadulescu
氮氧化物排放与自然语言处理综合研究数据集NitroNLP3Dataset-victorbadulescu 数据来源:互联网公开数据 标签:环境监测,自然语言处理,数据集,排放分析,机器学习,污染控制,环境科学,数据分析 数据概述: 该数据集包含来自多个国家和地区的大气污染物排放数据及相关的自然语言处理文本信息。主要特征如下:...