-
英印机器翻译练习数据集-arunmohan003
英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
-
西班牙政治推特语料库2023-ricardomoya
西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和...
-
Spacy测试数据集SpacyTestDataset-hhhurenyuan
Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
-
Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino
Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino 数据来源:互联网公开数据 标签:歌词,巴西,Spotify,音乐,流行文化,语言学,NLP,情感分析,音乐趋势,时间序列 数据概述:...
-
苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk
苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk 数据来源:互联网公开数据 标签:苹果,发布会,文本转录,语音识别,情感分析,关键词提取,NLP,产品发布,Apple Watch,AirPods,iPhone 16,Apple Intelligence 数据概述: 本数据集为2024年苹果秋季发布会(Apple...
-
数据2022年股市崩盘相关推特情感分析数据集-tejasurya
2022年股市崩盘相关推特情感分析数据集-tejasurya 数据来源:互联网公开数据 标签:股市崩盘,推特,情感分析,NLP,金融新闻,2022年,市场趋势,话题建模,BERT 数据概述:...
-
Linux系统日志分析数据集2021-ggsri123
Linux系统日志分析数据集2021-ggsri123 数据来源:互联网公开数据 标签:Linux,日志,系统监控,数据分析,异常检测,事件识别,多分类,模板匹配,NLP,开源数据 数据概述: 本数据集包含从LogPai...
-
特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi
特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi 数据来源:互联网公开数据 标签:特朗普,政治,集会,演讲稿,文本,NLP,自然语言处理,美国大选,言论分析,数据挖掘 数据概述:...
-
土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000
土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000 数据来源:互联网公开数据 标签:患者问答,医生回复,医疗咨询,土耳其语,NLP,自然语言处理,医疗研究,医学教育 数据概述: 本数据集收录了iCliniq平台上真实患者提出的医疗问题及其医生回复的土耳其语翻译版本。该数据集源于iCliniq Medical...
-
推特情感分析数据集TweetSentimentExtractionDataset-tunguz
推特情感分析数据集TweetSentimentExtractionDataset-tunguz 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本分类,机器学习,情感提取,社交媒体,NLP 数据概述: 该数据集包含来自推特(Twitter)的文本数据,旨在用于情感分析和情感提取任务。主要特征如下:...
-
医疗文本PHI受保护健康信息标注数据集-vijayakashv03
医疗文本PHI受保护健康信息标注数据集-vijayakashv03 数据来源:互联网公开数据 标签:PHI,医疗文本,数据标注,隐私保护,NLP,自然语言处理,文本处理,数据安全,敏感信息,信息脱敏 数据概述: 本数据集专为敏感信息脱敏设计,特别是受保护健康信息(PHI, Protected Health...
-
亚马逊客户产品评价情感分类数据集-2021年-uday756
亚马逊客户产品评价情感分类数据集-2021年-uday756 数据来源:互联网公开数据 标签:亚马逊,客户评价,情感分析,产品评价,自然语言处理,NLP,文本分类 数据概述:...
-
Yektanet波斯语网页文本主题分类数据集
Yektanet波斯语网页文本主题分类数据集 数据来源:互联网公开数据 标签:波斯语,NLP,文本分类,机器学习,网页数据,主题识别,自然语言处理 数据概述:...
-
垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal
垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,垃圾邮件,电子邮件,文本数据,机器学习,分类模型,邮件过滤,SPAM,HAM 数据概述:...
-
推特言论分类-有害言论与无害言论识别数据集-grodzina
推特言论分类-有害言论与无害言论识别数据集-grodzina 数据来源:互联网公开数据 标签:推特,有害言论,无害言论,自然语言处理,NLP,文本分类,社交媒体分析 数据概述:...
-
LLM基线模型评测数据集-aditya21511
LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。...
-
正则表达式与文本挖掘清理后的NLP数据集-janiscorona
正则表达式与文本挖掘清理后的NLP数据集-janiscorona 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,正则表达式,数据清洗,NLP,数据集,文本分析,数据预处理 数据概述: 该数据集包含了经过清洗和预处理的文本数据,主要用于自然语言处理(NLP)和文本挖掘任务。主要特征如下:...
-
英文单词全集数据集-lennartluik
英文单词全集数据集-lennartluik 数据来源:互联网公开数据 标签:英文单词,词汇库,英语学习,语言研究,自然语言处理,NLP 数据概述: 本数据集收录了《dwyl/english-...
-
情感分析数据集EmotionsData-rukenmissonnier
情感分析数据集EmotionsData-rukenmissonnier 数据来源:互联网公开数据 标签:情感分析,文本数据,数据集,自然语言处理,机器学习,情感识别,情绪分类,NLP 数据概述: 该数据集包含用于情感分析的文本数据,记录了各种文本片段及其对应的情感标签。主要特征如下: 时间跨度:...
-
命名实体识别数据集NER-animeshnareda
命名实体识别数据集NER-animeshnareda 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,人工智能,NLP 数据概述:该数据集包含来自多个领域的文本数据,用于训练和评估命名实体识别模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的新闻,文章和报告等。...



