找到5,810个数据集

标签: 文本分析

过滤结果
  • 邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan

    2025年4月24日   

    邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。...
    packageimg
  • TheExaminer点击诱饵新闻标题数据集

    2025年4月24日   

    TheExaminer点击诱饵新闻标题数据集 数据来源:互联网公开数据 标签:点击诱饵,新闻标题,媒体分析,数据挖掘,舆论研究,文本分析 数据概述: 本数据集收录了来自伪新闻网站The...
    packageimg
  • 家得宝深度学习解决方案数据集HomeDepotDeepLearningSolutionsDataset-roeiyehezkel

    2025年4月24日   

    家得宝深度学习解决方案数据集HomeDepotDeepLearningSolutionsDataset-roeiyehezkel 数据来源:互联网公开数据 标签:零售业,深度学习,数据集,商品推荐,文本分析,图像识别,机器学习,数据挖掘 数据概述: 该数据集来源于家得宝(Home...
    packageimg
  • 推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh

    2025年4月24日   

    推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh 数据来源:互联网公开数据 标签:社交媒体,推特,Nothing Phone,手机,用户行为,文本分析,情感分析,产品评论 数据概述: 本数据集包含了推特平台上用户发布的与“Nothing...
    packageimg
  • 正念主题学术论文摘要数据集AbstractsofArticlesonMindfulnessDataset-sandhyaavasthi

    2025年4月24日   

    正念主题学术论文摘要数据集AbstractsofArticlesonMindfulnessDataset-sandhyaavasthi 数据来源:互联网公开数据 标签:正念,学术论文,数据集,心理学,健康研究,文本分析,文献综述,学术资源 数据概述:...
    packageimg
  • 仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud

    2025年4月24日   

    仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论,数据集,文本分类,机器学习,社会媒体,文本分析,情感分析 数据概述:...
    packageimg
  • 组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet

    2025年4月24日   

    组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:...
    packageimg
  • 技术问题编辑数据集-sshikamaru

    2025年4月24日   

    技术问题编辑数据集-sshikamaru 数据来源:互联网公开数据 标签:技术问题,编辑,数据集,技术文档,文本分析,问题解决,自然语言处理,技术支持 数据概述:该数据集包含来自编辑技术问题的记录,详细记录了用户提出的技术问题及其解决方案。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 亚马逊食品评论平衡数据集2021-lillynguyen0510

    2025年4月24日   

    亚马逊食品评论平衡数据集2021-lillynguyen0510 数据来源:互联网公开数据 标签:亚马逊,食品评论,机器学习,数据集,评分,文本分析,平衡数据 数据概述:...
    packageimg
  • 唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari

    2025年4月24日   

    唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari 数据来源:互联网公开数据 标签:推特,社交媒体,政治,数据集,文本分析,自然语言处理,社会学,政治评论 数据概述:该数据集包含唐纳德特朗普在任期内发布的推特内容,记录了他作为一个公众人物在推特平台上发表的言论。主要特征如下:...
    packageimg
  • 维基百科句子数据集WikiSentencesV2-ranjitp20

    2025年4月24日   

    维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:...
    packageimg
  • Mistral-8k困惑度评估数据集-hozaifazaki

    2025年4月24日   

    Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。...
    packageimg
  • 英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro

    2025年4月24日   

    英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,双语数据,英语,法语,文本分析,人工智能 数据概述: 该数据集包含来自公开来源的英语-...
    packageimg
  • 商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141

    2025年4月24日   

    商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:...
    packageimg
  • Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane

    2025年4月23日   

    Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,机器学习,文本分析,深度学习,语义理解,人工智能 数据概述: 该数据集包含Solon词嵌入模型生成的词向量数据,记录了大量词汇在多维空间中的表示。主要特征如下:...
    packageimg
  • 综合标签数据集CombinedLabelledDataset-kathank

    2025年4月23日   

    综合标签数据集CombinedLabelledDataset-kathank 数据来源:互联网公开数据 标签:综合标签,数据集,机器学习,文本分析,自然语言处理,分类,标注,数据科学 数据概述:该数据集包含来自多个来源的综合标签数据,记录了文本数据及其对应的标签,适用于机器学习和自然语言处理任务。主要特征如下:...
    packageimg
  • 标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe

    2025年4月23日   

    标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe 数据来源:互联网公开数据 标签:情感分析,数据集,推特,自然语言处理,机器学习,文本分析,社交媒体,社会研究 数据概述:该数据集包含来自推特的标题数据,记录了推特用户发布的标题及其对应的情感标签。主要特征如下:...
    packageimg
  • 真假新闻辨识文章数据集-2016至2017年-abkrishna05

    2025年4月23日   

    真假新闻辨识文章数据集-2016至2017年-abkrishna05 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分类,文本分析,数据集,信息验证,机器学习,文本挖掘 数据概述: 本数据集包含2016年至2017年间收集的真假新闻文章数据,共分为两个文件:Fake.csv 和...
    packageimg
  • 训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda

    2025年4月23日   

    训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda 数据来源:互联网公开数据 标签:机器学习,自然语言处理,数据集,模型训练,文本分析,上下文理解,深度学习,人工智能 数据概述: 该数据集包含用于训练和修改模型上下文的数据,记录了用于提升模型理解和生成能力的文本数据。主要特征如下:...
    packageimg
  • 推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo

    2025年4月23日   

    推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo 数据来源:互联网公开数据 标签:社交媒体,新冠疫情,数据集,流行病学,文本分析,机器学习,公共卫生,信息传播 数据概述: 该数据集包含来自Twitter平台与新冠疫情相关的公开帖子数据,记录了用户在疫情期间的讨论内容,互动情况及传播特征。主要特征如下:...
    packageimg