-
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:... -
新闻处理数据集NewsProcessedDataset-mario123475
新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:... -
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti 数据来源:互联网公开数据 标签:自然语言处理,特征工程,数据集,文本分析,机器学习,语言学,数据科学,人工智能... -
航空公司微博评论数据集AirlineReviewsonTwitterDataset-jdhruvr
航空公司微博评论数据集AirlineReviewsonTwitterDataset-jdhruvr 数据来源:互联网公开数据 标签:航空业,社交媒体,数据集,自然语言处理,情感分析,机器学习,消费者行为,客户服务 数据概述: 该数据集包含来自微博平台上关于航空公司的用户评论数据,记录了消费者对航空公司服务的评价和反馈。主要特征如下:... -
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,视频内容,演讲者,主题分类,自然语言处理,教育与培训 数据概述:该数据集包含来自TED官方网站的演讲内容,记录了自2006年以来的TED演讲的详细信息和文本内容。主要特征如下:... -
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:... -
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut 数据来源:互联网公开数据 标签:光学字符识别,自然语言处理,数据集,图像处理,文本分析,机器学习,人工智能,计算机视觉 数据概述: 该数据集包含通过光学字符识别(OCR)技术与 Gemini... -
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-mastersniffer
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-mastersniffer 数据来源:互联网公开数据 标签:情感分析,评论数据,自然语言处理,机器学习,文本挖掘,电商,用户评价,数据集 数据概述: 该数据集包含来自亚马逊网站的商品评论数据,用于情感分析和文本挖掘任务。主要特征如下:... -
LLM基线模型评测数据集-aditya21511
LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。... -
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine... -
CORD-19研究任务相关性评分数据集
CORD-19研究任务相关性评分数据集 数据来源:互联网公开数据 标签:CORD-19,研究任务,相关性评分,自然语言处理,LSA,学术研究,竞赛数据 数据概述:... -
仇恨言论检测数据集HateSpeechDetectionDataset-divanshu22
仇恨言论检测数据集HateSpeechDetectionDataset-divanshu22 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,文本分类,机器学习,情感分析,社交媒体,文本挖掘 数据概述: 该数据集包含来自社交媒体平台的数据,记录了各种形式的仇恨言论文本。主要特征如下:... -
微博情感分析数据集WeiboSentimentAnalysisDataset-lindiefan
微博情感分析数据集WeiboSentimentAnalysisDataset-lindiefan 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分类,情感计算,大数据 数据概述: 该数据集包含来自微博平台的文本数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:... -
正则表达式与文本挖掘清理后的NLP数据集-janiscorona
正则表达式与文本挖掘清理后的NLP数据集-janiscorona 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,正则表达式,数据清洗,NLP,数据集,文本分析,数据预处理 数据概述: 该数据集包含了经过清洗和预处理的文本数据,主要用于自然语言处理(NLP)和文本挖掘任务。主要特征如下:... -
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany 数据来源:互联网公开数据 标签:用户评价,出行服务,数据集,文本分析,情感分析,自然语言处理,服务质量,移动应用 数据概述:该数据集包含来自GoJek用户的应用评价数据,记录了用户对GoJek出行服务的反馈和体验。主要特征如下:... -
英文单词全集数据集-lennartluik
英文单词全集数据集-lennartluik 数据来源:互联网公开数据 标签:英文单词,词汇库,英语学习,语言研究,自然语言处理,NLP 数据概述: 本数据集收录了《dwyl/english-... -
消费者投诉分类数据集2010-2021年-deepikaarikesavan
消费者投诉分类数据集2010-2021年-deepikaarikesavan 数据来源:互联网公开数据 标签:消费者投诉,数据集,分类分析,自然语言处理,机器学习,数据建模,客户服务,市场研究 数据概述:该数据集包含来自消费者投诉数据库的数据,记录了2010年至2021年间消费者向相关部门提交的投诉信息。主要特征如下:... -
聊天机器人对话数据集ChatbotCSVDataset-hageribrahim55
聊天机器人对话数据集ChatbotCSVDataset-hageribrahim55 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,聊天机器人,人工智能,文本分析,数据挖掘 数据概述: 该数据集包含来自聊天机器人对话系统的数据,记录了用户与聊天机器人之间的互动对话内容。主要特征如下:... -
医学实体识别数据集MedRedNERDataset-quctngngvng
医学实体识别数据集MedRedNERDataset-quctngngvng 数据来源:互联网公开数据 标签:医学,实体识别,数据集,自然语言处理,机器学习,生物信息学,临床文本,文本挖掘 数据概述: 该数据集包含来自医学领域的文本数据,记录了临床病历,医学报告等文档中的实体信息。主要特征如下:... -
情感分析数据集EmotionsData-rukenmissonnier
情感分析数据集EmotionsData-rukenmissonnier 数据来源:互联网公开数据 标签:情感分析,文本数据,数据集,自然语言处理,机器学习,情感识别,情绪分类,NLP 数据概述: 该数据集包含用于情感分析的文本数据,记录了各种文本片段及其对应的情感标签。主要特征如下: 时间跨度:...