-
母亲节相关推文数据集MothersDayTweetsDataset-ajax0564
母亲节相关推文数据集MothersDayTweetsDataset-ajax0564 数据来源:互联网公开数据 标签:社交媒体,推文分析,节日营销,数据挖掘,情感分析,自然语言处理,网络行为,市场研究 数据概述: 该数据集包含来自Twitter平台的数据,记录了在母亲节期间用户发布的与节日相关的推文内容。主要特征如下:... -
新闻语料库词频统计数据集-2023-pduvvuri0308
新闻语料库词频统计数据集-2023-pduvvuri0308 数据来源:互联网公开数据 标签:词频统计,新闻语料库,文本分析,自然语言处理,NLP,数据集,文本挖掘 数据概述:... -
推特机器人数据集TweeterBotsDataset-saurabh778
推特机器人数据集TweeterBotsDataset-saurabh778 数据来源:互联网公开数据 标签:社交媒体,数据集,机器人检测,自然语言处理,机器学习,社交网络分析,网络安全,人工智能 数据概述: 该数据集包含来自推特的用户数据,用于识别和检测推特上的机器人账户(bots)。主要特征如下:... -
推特情感分析数据集TweetSentimentAnalysisDataset-itoeiji
推特情感分析数据集TweetSentimentAnalysisDataset-itoeiji 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本挖掘,机器学习,社交媒体,舆情分析,情绪识别 数据概述: 该数据集包含了来自推特(Twitter)的推文数据,并标注了相应的情感极性。主要特征如下:... -
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang 数据来源:互联网公开数据 标签:越南语,拼写错误,数据集,自然语言处理,机器学习,语言学研究,文本分析,错误检测 数据概述: 该数据集包含越南语中的拼写错误数据,记录了越南语文本中的错误拼写及其正确形式。主要特征如下:... -
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746 数据来源:互联网公开数据 标签:短信分类,垃圾信息,数据集,文本分析,机器学习,自然语言处理,信息过滤,通信安全 数据概述: 该数据集包含来自公开短信数据源的短信信息,记录了用户接收的短信内容及其分类标签(垃圾短信或正常短信)。主要特征如下:... -
越南医疗问答数据集VietnamMedicalQADataset-quangphm
越南医疗问答数据集VietnamMedicalQADataset-quangphm 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,人工智能,健康咨询,医疗信息,医学研究,机器学习 数据概述:该数据集包含来自越南的医疗问答数据,记录了患者与医生之间的医疗咨询对话。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2021年。... -
Audible有声书评论数据AudibleUncleanedDateChangedDataset-shresthajeevan
Audible有声书评论数据AudibleUncleanedDateChangedDataset-shresthajeevan 数据来源:互联网公开数据 标签:有声书,评论数据,自然语言处理,文本分析,情感分析,时间序列,数据清洗,Audible 数据概述:... -
波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151
波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,语言学,情感挖掘,波斯语 数据概述:... -
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:... -
主题建模数据集TopicModelingDataset-quangvinhtrnh
主题建模数据集TopicModelingDataset-quangvinhtrnh 数据来源:互联网公开数据 标签:主题建模,数据集,自然语言处理,文本分析,机器学习,数据挖掘,信息检索,文本挖掘 数据概述: 该数据集专注于主题建模任务,包含来自多个来源的文本数据,用于分析文本内容中的潜在主题。主要特征如下:... -
滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen
滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen 数据来源:互联网公开数据 标签:媒体分析,自然语言处理,实体识别,数据集,文本挖掘,机器学习,新闻分析,内容分析 数据概述: 该数据集包含来自滚石杂志(Rolling... -
南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah
南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah 数据来源:互联网公开数据 标签:垃圾邮件,数据集,邮件过滤,自然语言处理,机器学习,信息安全,文本分析,学术资源 数据概述:该数据集由南洋理工大学提供,主要用于垃圾邮件的识别和过滤。主要特征如下: 时间跨度:数据记录的时间范围从2002年到2004年。... -
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro 数据来源:互联网公开数据 标签:亚马逊,意大利,评论,情感分析,评分,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含来自亚马逊意大利站的商品评论,共计17,340条,每条评论均包含以下字段: score(评分):客户给出的评分,通常为1-5星。... -
亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55
亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55 数据来源:互联网公开数据 标签:商品评论,数据集,电子商务,自然语言处理,消费者行为,市场分析,用户反馈,文本挖掘 数据概述:该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:... -
数据2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu
2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu 数据来源:互联网公开数据 标签:文本检索,COVID-19,数据集,信息检索,自然语言处理,机器学习,数据挖掘,公共卫生 数据概述:... -
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
僧伽罗语新闻标题数据集-nawarathnadeshan
僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。... -
数据2021年T20世界杯推文数据集-shahidkhan1
2021年T20世界杯推文数据集-shahidkhan1 数据来源:互联网公开数据 标签:推文数据,板球,T20世界杯,社交媒体分析,情感分析,自然语言处理,体育,数据集 数据概述: 该数据集包含了来自2021年T20世界杯期间的推文数据,记录了全球用户在社交媒体上关于赛事讨论的各种信息。主要特征如下:...