-
新冠疫情新闻可信度研究数据集-csmalarkodi
新冠疫情新闻可信度研究数据集-csmalarkodi 数据来源:互联网公开数据 标签:新冠疫情,新闻,可信度,数据集,自然语言处理,机器学习,舆情分析,信息溯源 数据概述: 该数据集包含关于新冠疫情的新闻报道,旨在研究新闻的可信度和信息传播特征。主要特征如下: 时间跨度:数据记录的时间范围从2020年初至2023年。... -
产品描述数据集2015-2020数据集-ramrajurkar013
产品描述数据集2015-2020数据集-ramrajurkar013 数据来源:互联网公开数据 标签:产品描述,数据集,电子商务,市场分析,机器学习,自然语言处理,消费者行为,产品分类 数据概述: 该数据集包含来自多个电商平台的产品描述数据,记录了从2015年到2020年期间的产品详细信息。主要特征如下:... -
维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran
维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran 数据来源:互联网公开数据 标签:维基百科,错误纠正,数据集,自然语言处理,文本分析,机器学习,信息质量,数据清洗 数据概述: 该数据集包含来自维基百科的错误纠正数据,记录了维基百科页面中存在的错误及其纠正信息。主要特征如下:... -
大型语言模型融合数据集LLMMergingDataset-aakashgupta21
大型语言模型融合数据集LLMMergingDataset-aakashgupta21 数据来源:互联网公开数据 标签:大型语言模型,模型融合,数据集,自然语言处理,机器学习,人工智能,文本分析,深度学习 数据概述: 该数据集包含来自多个大型语言模型的数据,记录了模型融合过程中使用的文本数据和相关特征。主要特征如下:... -
灾害测试数据集DisasterTestDataset-timhurt
灾害测试数据集DisasterTestDataset-timhurt 数据来源:互联网公开数据 标签:灾害,数据集,测试,应急响应,机器学习,自然语言处理,文本分类,社会媒体分析 数据概述:该数据集包含来自多个社交媒体平台的灾害相关测试数据,记录了用户在灾害发生后发布的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。... -
摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg
摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,阿拉伯语,文本分类,情感分析,机器学习,语言学 数据概述: 该数据集包含摩洛哥阿拉伯语(Darija)文本,用于仇恨言论检测任务。主要特征如下: 时间跨度:... -
自然语言处理文件数据集NLPFilesDataset-germanarley
自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:... -
自然语言处理推文数据集NLPTweetDataDataset-vntkalosiya
自然语言处理推文数据集NLPTweetDataDataset-vntkalosiya 数据来源:互联网公开数据 标签:自然语言处理,推文分析,社交媒体,数据集,情感分析,文本挖掘,机器学习,大数据 数据概述: 该数据集包含来自社交媒体平台推文的数据,记录了用户在推文中的文本内容和相关信息。主要特征如下:... -
瑞克与莫蒂Discord聊天机器人数据集RickandMortyDiscordChatbotDataset-zerofactorialisone
瑞克与莫蒂Discord聊天机器人数据集RickandMortyDiscordChatbotDataset-zerofactorialisone 数据来源:互联网公开数据 标签:瑞克与莫蒂,Discord,聊天记录,数据集,自然语言处理,文本分析,机器学习,角色互动 数据概述: 该数据集包含了瑞克与莫蒂(Rick and... -
烂番茄芭比电影影评数据集-jihanalfi
烂番茄芭比电影影评数据集-jihanalfi 数据来源:互联网公开数据 标签:电影,影评,烂番茄,芭比,情感分析,自然语言处理,数据集,娱乐业 数据概述: 该数据集包含了来自烂番茄网站的芭比电影影评数据,记录了影评的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为电影上映前后。 地理范围:数据来源于全球范围内的烂番茄网站。... -
客户支持请求处理数据集CustomerSupportRequestHandlingDataset-kaifibrahim
客户支持请求处理数据集CustomerSupportRequestHandlingDataset-kaifibrahim 数据来源:互联网公开数据 标签:客户支持,数据集,客户服务,自然语言处理,机器学习,客户满意度,客户关系管理,客户服务分析... -
YouTube评论数据集YouTubeCommentDataset-dharshinibalaji
YouTube评论数据集YouTubeCommentDataset-dharshinibalaji 数据来源:互联网公开数据 标签:YouTube,评论,数据集,自然语言处理,文本分析,情感分析,社交媒体,用户行为 数据概述: 该数据集包含来自 YouTube 平台的评论数据,记录了用户在 YouTube 视频下方的评论信息。主要特征如下:... -
AI生成内容检测数据集SanjanaAIFinalDataset-ksanjana2001
AI生成内容检测数据集SanjanaAIFinalDataset-ksanjana2001 数据来源:互联网公开数据 标签:人工智能,文本分析,内容生成,数据集,机器学习,自然语言处理,检测模型,虚假信息 数据概述: 该数据集包含由Sanjana AI项目生成的内容以及人工标注的真实性标签,用于训练和评估AI生成内容的检测模型。主要特征如下:... -
情绪识别数据集主题-情绪识别场景-文本分析对象-中性-悲伤-快乐-愤怒时间-未指定-taherhasan
情绪识别数据集主题-情绪识别场景-文本分析对象-中性-悲伤-快乐-愤怒时间-未指定-taherhasan 数据来源:互联网公开数据 标签:情绪识别,数据集,文本分析,自然语言处理,机器学习,情感计算,心理学,人工智能 数据概述:该数据集包含来自GoEmotions项目的情绪标注文本数据,主要记录了中性,悲伤,快乐和愤怒四种情绪的文本样本。主要特征如下:... -
安然公司邮件数据集TruncatedEnronDataset-loryn808
安然公司邮件数据集TruncatedEnronDataset-loryn808 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,社交网络分析,金融,欺诈,数据泄露 数据概述: 该数据集包含来自安然公司员工的电子邮件,记录了安然公司破产前后的内部通信。主要特征如下: 时间跨度:数据记录的时间范围为1999年至2002年。... -
AST-SQL数据集AST-SQLDataset-youssefhazemfarouk
AST-SQL数据集AST-SQLDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:自然语言处理,SQL生成,数据集,机器学习,数据库,文本分析,语言模型,数据查询 数据概述: 该数据集专注于自然语言到SQL的转换任务,记录了如何将自然语言查询语句转换为相应的SQL查询语句。主要特征如下:... -
垃圾邮件分类数据集SpamClassificationData-dkhalidashik
垃圾邮件分类数据集SpamClassificationData-dkhalidashik 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,自然语言处理,机器学习,文本挖掘,邮件过滤,信息检索 数据概述: 该数据集包含用于垃圾邮件分类的文本数据,记录了大量邮件及其对应的标签,用于训练和评估垃圾邮件检测模型。主要特征如下:... -
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:... -
抑郁症预测数据集FullDataPredictingDepressionDataset-jeremyteo
抑郁症预测数据集FullDataPredictingDepressionDataset-jeremyteo 数据来源:互联网公开数据 标签:抑郁症,预测,心理健康,机器学习,数据集,情感分析,自然语言处理,医学 数据概述: 该数据集包含用于预测抑郁症的数据,记录了个体在不同时间点的心理健康相关信息。主要特征如下:... -
英语写作关联特征训练数据集-kentakikuhi
英语写作关联特征训练数据集-kentakikuhi 数据来源:互联网公开数据 标签:英语写作,数据集,自然语言处理,文本分析,机器学习,语言模型,写作质量,关联特征 数据概述: 该数据集包含了用于训练英语写作关联特征的数据,旨在提升写作质量和理解写作模式。主要特征如下: 时间跨度:数据没有明确的时间跨度,但通常涵盖现代英语写作。...