-
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。... -
TheExaminer点击诱饵新闻标题数据集
TheExaminer点击诱饵新闻标题数据集 数据来源:互联网公开数据 标签:点击诱饵,新闻标题,媒体分析,数据挖掘,舆论研究,文本分析 数据概述: 本数据集收录了来自伪新闻网站The... -
家得宝深度学习解决方案数据集HomeDepotDeepLearningSolutionsDataset-roeiyehezkel
家得宝深度学习解决方案数据集HomeDepotDeepLearningSolutionsDataset-roeiyehezkel 数据来源:互联网公开数据 标签:零售业,深度学习,数据集,商品推荐,文本分析,图像识别,机器学习,数据挖掘 数据概述: 该数据集来源于家得宝(Home... -
推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh
推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh 数据来源:互联网公开数据 标签:社交媒体,推特,Nothing Phone,手机,用户行为,文本分析,情感分析,产品评论 数据概述: 本数据集包含了推特平台上用户发布的与“Nothing... -
正念主题学术论文摘要数据集AbstractsofArticlesonMindfulnessDataset-sandhyaavasthi
正念主题学术论文摘要数据集AbstractsofArticlesonMindfulnessDataset-sandhyaavasthi 数据来源:互联网公开数据 标签:正念,学术论文,数据集,心理学,健康研究,文本分析,文献综述,学术资源 数据概述:... -
仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud
仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论,数据集,文本分类,机器学习,社会媒体,文本分析,情感分析 数据概述:... -
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:... -
技术问题编辑数据集-sshikamaru
技术问题编辑数据集-sshikamaru 数据来源:互联网公开数据 标签:技术问题,编辑,数据集,技术文档,文本分析,问题解决,自然语言处理,技术支持 数据概述:该数据集包含来自编辑技术问题的记录,详细记录了用户提出的技术问题及其解决方案。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
亚马逊食品评论平衡数据集2021-lillynguyen0510
亚马逊食品评论平衡数据集2021-lillynguyen0510 数据来源:互联网公开数据 标签:亚马逊,食品评论,机器学习,数据集,评分,文本分析,平衡数据 数据概述:... -
唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari
唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari 数据来源:互联网公开数据 标签:推特,社交媒体,政治,数据集,文本分析,自然语言处理,社会学,政治评论 数据概述:该数据集包含唐纳德特朗普在任期内发布的推特内容,记录了他作为一个公众人物在推特平台上发表的言论。主要特征如下:... -
维基百科句子数据集WikiSentencesV2-ranjitp20
维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:... -
Mistral-8k困惑度评估数据集-hozaifazaki
Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。... -
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,双语数据,英语,法语,文本分析,人工智能 数据概述: 该数据集包含来自公开来源的英语-... -
商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141
商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:... -
Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane
Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,机器学习,文本分析,深度学习,语义理解,人工智能 数据概述: 该数据集包含Solon词嵌入模型生成的词向量数据,记录了大量词汇在多维空间中的表示。主要特征如下:... -
综合标签数据集CombinedLabelledDataset-kathank
综合标签数据集CombinedLabelledDataset-kathank 数据来源:互联网公开数据 标签:综合标签,数据集,机器学习,文本分析,自然语言处理,分类,标注,数据科学 数据概述:该数据集包含来自多个来源的综合标签数据,记录了文本数据及其对应的标签,适用于机器学习和自然语言处理任务。主要特征如下:... -
标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe
标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe 数据来源:互联网公开数据 标签:情感分析,数据集,推特,自然语言处理,机器学习,文本分析,社交媒体,社会研究 数据概述:该数据集包含来自推特的标题数据,记录了推特用户发布的标题及其对应的情感标签。主要特征如下:... -
真假新闻辨识文章数据集-2016至2017年-abkrishna05
真假新闻辨识文章数据集-2016至2017年-abkrishna05 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分类,文本分析,数据集,信息验证,机器学习,文本挖掘 数据概述: 本数据集包含2016年至2017年间收集的真假新闻文章数据,共分为两个文件:Fake.csv 和... -
训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda
训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda 数据来源:互联网公开数据 标签:机器学习,自然语言处理,数据集,模型训练,文本分析,上下文理解,深度学习,人工智能 数据概述: 该数据集包含用于训练和修改模型上下文的数据,记录了用于提升模型理解和生成能力的文本数据。主要特征如下:... -
推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo
推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo 数据来源:互联网公开数据 标签:社交媒体,新冠疫情,数据集,流行病学,文本分析,机器学习,公共卫生,信息传播 数据概述: 该数据集包含来自Twitter平台与新冠疫情相关的公开帖子数据,记录了用户在疫情期间的讨论内容,互动情况及传播特征。主要特征如下:...