-
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy 数据来源:互联网公开数据 标签:文本纠错, 越南语, 自然语言处理, 语言模型, 错误检测, 文本校正, 深度学习, 数据集 数据概述: 该数据集包含越南语文本,记录了原始句子及其对应的错误句子,用于越南语文本纠错任务。主要特征如下:... -
植物图像描述生成数据集PlantImageCaptioningDataset-mahsamohammady
植物图像描述生成数据集PlantImageCaptioningDataset-mahsamohammady 数据来源:互联网公开数据 标签:图像识别, 图像描述, 计算机视觉, 自然语言处理, 数据标注, 多模态学习, 文本生成, 植物学 数据概述: 该数据集包含植物图像及其对应的文本描述,用于训练和评估图像描述生成模型。主要特征如下:... -
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx 数据来源:互联网公开数据 标签:文本校对, 润色, 错误检测, 自然语言处理, 文本纠错, 机器学习, 数据清洗, 语料库 数据概述:... -
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar 数据来源:互联网公开数据 标签:虚假评论,数据集,自然语言处理,文本分类,机器学习,电商分析,情感分析,数据挖掘 数据概述: 该数据集包含来自电商平台或社交媒体的评论数据,记录了用户对产品或服务的评价内容及其真实性标签。主要特征如下:... -
问答对相似度分析训练测试数据集QuestionPairsSimilarityAnalysisTrainingandTestingDataset-shilpil
问答对相似度分析训练测试数据集QuestionPairsSimilarityAnalysisTrainingandTestingDataset-shilpil 数据来源:互联网公开数据 标签:问答对, 文本相似度, 自然语言处理, 文本匹配, 机器学习, 深度学习, 数据集, 问答系统 数据概述:... -
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu 数据来源:互联网公开数据 标签:足球, 新闻摘要, 自然语言处理, 文本分析, 赛事报道, 东南亚, 越南, 机器学习 数据概述:... -
音频情感分析数据集UB-Audio05out-yumoan
音频情感分析数据集UB-Audio05out-yumoan 数据来源:互联网公开数据 标签:音频,情感分析,数据集,语音识别,机器学习,自然语言处理,情感识别,声学特征 数据概述: 该数据集包含来自UB-Audio项目的音频数据,主要用于音频情感分析任务。主要特征如下: 时间跨度:数据录制时间跨度未知,但数据涵盖了多种情感表达。... -
文本语义相似度判断数据集TextSemanticSimilarityJudgmentDataset-shaffaka
文本语义相似度判断数据集TextSemanticSimilarityJudgmentDataset-shaffaka 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 对比分析, 机器学习, 数据集, 文本对, 语义理解 数据概述: 该数据集包含从公开文本资源中提取的文本对,记录了句子对之间的语义相似度判断结果。主要特征如下:... -
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-... -
孟加拉文图形字符预训练权重数据集BanglaGraphemesPretrainedWeightsDataset-shawon10
孟加拉文图形字符预训练权重数据集BanglaGraphemesPretrainedWeightsDataset-shawon10 数据来源:互联网公开数据 标签:计算机视觉,字符识别,深度学习,预训练模型,自然语言处理,机器学习,Bangla语言,多语种处理 数据概述:... -
YouTube评论训练数据集YouTubeCommentTrainDataset-chintadasrinivasa
YouTube评论训练数据集YouTubeCommentTrainDataset-chintadasrinivasa 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,自然语言处理,情感分析,机器学习,文本挖掘,数据科学 数据概述:该数据集包含来自YouTube平台的评论数据,记录了用户对视频内容的反馈和观点。主要特征如下:... -
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 文本分析, 自然语言处理, 情感分析, 话题挖掘, 人工智能, 机器学习 数据概述:... -
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj 数据来源:互联网公开数据 标签:图像描述, 文本嵌入, 计算机视觉, 自然语言处理, 图像检索, 语义分析, 深度学习, 多模态 数据概述:... -
文本生成与标题创建数据集FLAN-T5-Small512-TitleDatasets-terrychanorg
文本生成与标题创建数据集FLAN-T5-Small512-TitleDatasets-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,标题创建,机器学习,深度学习,数据集,语言模型,人工智能 数据概述:... -
亚马逊手机评论数据集AmazonCellPhonesReviewsDataset-liviovona24
亚马逊手机评论数据集AmazonCellPhonesReviewsDataset-liviovona24 数据来源:互联网公开数据 标签:手机评论,电商,用户评价,情感分析,自然语言处理,文本挖掘,机器学习,产品分析 数据概述: 该数据集包含来自亚马逊平台的手机产品评论数据,记录了用户对手机产品的评价和反馈。主要特征如下:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
电子邮件钓鱼检测数据集-dhruvagarwal433
电子邮件钓鱼检测数据集-dhruvagarwal433 数据来源:互联网公开数据 标签:电子邮件,钓鱼检测,网络安全,机器学习,自然语言处理,文本分析,恶意软件,欺诈 数据概述: 该数据集包含了用于电子邮件钓鱼检测的数据,旨在帮助研究人员和安全专家开发和评估钓鱼邮件的识别技术。主要特征如下:... -
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia 数据来源:互联网公开数据 标签:数字图书馆,数据集,文本分析,信息检索,机器学习,学术资源,自然语言处理,知识管理 数据概述: 该数据集包含来自布拉斯-数字图书馆(Bolsa-DL)的文本数据,记录了该数字图书馆中的学术文献和书籍信息。主要特征如下:... -
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,人工智能,语言模型,机器学习,文本生成,深度学习 数据概述: 该数据集包含来自多个来源的文本数据,记录了用于生成魔法提示的文本样本。主要特征如下: 时间跨度:数据记录的时间范围为最近一年。... -
医学推文情感分析数据集Tweets-MedDataset-milanezeus
医学推文情感分析数据集Tweets-MedDataset-milanezeus 数据来源:互联网公开数据 标签:医学,推文,情感分析,社交媒体,NLP,自然语言处理,情感识别,文本挖掘 数据概述: 该数据集包含来自Twitter的医学相关推文数据,记录了用户在社交媒体上对医疗健康话题的讨论和观点。主要特征如下:...