-
孟加拉语词汇数据集-公交玛玛项目-rafsun
孟加拉语词汇数据集-公交玛玛项目-rafsun 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,NLP,公交玛玛,学生出行,聊天机器人,词汇数据 数据概述: 本数据集是为公交玛玛项目中的聊天机器人功能而收集,旨在支持孟加拉语的交流,方便学生公交出行。数据集包含六种类型的数据,具体如下: stop_words:停用词,共385个... -
产品分类数据集-itsrohanism
产品分类数据集-itsrohanism 数据来源:互联网公开数据 标签:产品分类,数据集,文本分类,自然语言处理,机器学习,电商,商品信息,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,记录了各种产品的详细描述和类别标签。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期电商平台上的产品信息。... -
诺维雅语料库数据集NoviaKorpusDataset-noviafadina
诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied... -
LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek
LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek 数据来源:互联网公开数据 标签:招聘数据,LinkedIn,职位信息,数据抓取,文本分析,自然语言处理,求职,职业发展 数据概述:... -
词汇索引数据集WordIndexesDataset-virenmohanlal
词汇索引数据集WordIndexesDataset-virenmohanlal 数据来源:互联网公开数据 标签:语言学,词汇索引,数据集,文本分析,自然语言处理,教育研究,数据挖掘,语言学习 数据概述: 该数据集包含词汇索引数据,记录了词汇的索引,频率,词性等信息。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,可能覆盖多个时间段。... -
网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn
网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn 数据来源:互联网公开数据 标签:网络评论,毒性检测,数据集,自然语言处理,机器学习,文本分析,情感分析,社交媒体 数据概述:该数据集来自Jigsaw团队,记录了来自Reddit平台的网络评论及其标签,适用于毒性评论检测和自然语言处理研究。主要特征如下:... -
越南语情感分析数据集-datvuthanh
越南语情感分析数据集-datvuthanh 数据来源:互联网公开数据 标签:情感分析,自然语言处理,越南语,数据集,文本分类,机器学习,社交媒体,观点挖掘 数据概述: 该数据集包含越南语文本,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录时间跨度未知,但主要反映了越南语社交媒体和评论中常见的情感表达。... -
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,深度学习,IMDB 数据概述:... -
最后生还者系列游戏评论数据集-2011至2023-lazaro97
最后生还者系列游戏评论数据集-2011至2023-lazaro97 数据来源:互联网公开数据 标签:视频游戏,评论,游戏评价,玩家反馈,游戏分析,游戏批评,数据挖掘,文本分类,自然语言处理 数据概述:... -
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,数据集,文本分析,机器学习,NLP,语言学,评估 数据概述: 该数据集包含用于评估英语句子语义相似度的测试数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集发布时间。 地理范围:... -
社交媒体评论数据集CommentDataDataset-jiangshanzhizhu
社交媒体评论数据集CommentDataDataset-jiangshanzhizhu 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,自然语言处理,机器学习,数据挖掘,用户行为 数据概述: 该数据集包含来自多个社交媒体平台的用户评论数据,记录了用户在特定话题或产品上的互动和反馈。主要特征如下:... -
共同基金用户咨询问题分类数据集-aloktantrik
共同基金用户咨询问题分类数据集-aloktantrik 数据来源:互联网公开数据 标签:共同基金,用户咨询,文本分类,自然语言处理,金融科技,数据分析,机器学习,NLP 数据概述:... -
Evol-Codealpaca中英指令转换数据集
Evol-Codealpaca中英指令转换数据集 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,中英翻译,指令转换,代码生成,语言模型,数据集,Hugging Face 数据概述: 本数据集由Evol-... -
大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen
大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen 数据来源:互联网公开数据 标签:大语言模型,科学问题,数据集,自然语言处理,机器学习,知识图谱,科学教育,人工智能 数据概述: 该数据集包含来自大语言模型与科学问题识别研究的数据,记录了科学问题的文本内容及其相关特征。主要特征如下:... -
预训练模型数据集
预训练模型数据集 数据来源:互联网公开数据 标签:预训练模型,自然语言处理,深度学习,模型训练,人工智能,模型架构,训练数据,性能评估,语言模型 数据概述:... -
法语语法纠错数据集JFLEGFrenchGrammarCorrectionDataset-turiabu
法语语法纠错数据集JFLEGFrenchGrammarCorrectionDataset-turiabu 数据来源:互联网公开数据 标签:语法纠错,自然语言处理,数据集,机器学习,语言模型,文本处理,法语,人工智能 数据概述: 该数据集包含来自JFLEG项目(JFLEG French Grammar... -
自动情感分析数据集AES2FoldsDataset-syhens
自动情感分析数据集AES2FoldsDataset-syhens 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,人工智能,情感识别 数据概述: 该数据集包含来自自动情感分析研究的数据,记录了文本内容的情感倾向和情感强度。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
阿萨姆语文本到语音数据集
阿萨姆语文本到语音数据集 数据来源:互联网公开数据 标签:阿萨姆语,文本到语音,语音合成,语言技术,机器学习,自然语言处理,音频数据 数据概述: 本数据集是一个为阿萨姆语语音合成研究专门整理的资源,包含1877个阿萨姆语文本样本及其对应的音频录音。音频文件时长较短,平均约为3-4秒。数据集为开发和训练阿萨姆语的文本到语音(TTS)系统提供了基础支持。... -
乌克兰诗歌数据集UkrainianPoemsDataset-viktoriashvets
乌克兰诗歌数据集UkrainianPoemsDataset-viktoriashvets 数据来源:互联网公开数据 标签:诗歌,乌克兰,文学,文化研究,自然语言处理,文本分析,数据集,诗歌翻译 数据概述: 该数据集包含乌克兰诗歌的文本数据,旨在为研究乌克兰文学和文化提供资源。主要特征如下: 时间跨度:... -
情感分析-情绪分类数据集Emotions-6000-farwarizvi
情感分析-情绪分类数据集Emotions-6000-farwarizvi 数据来源:互联网公开数据 标签:情感分析,情绪分类,自然语言处理,文本数据,心理健康,情感识别,情绪,NLP,机器学习 数据概述:...