找到2,649个数据集

标签: 文本挖掘

过滤结果
  • 印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3

    2025年4月23日   

    印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3 数据来源:互联网公开数据 标签:印尼语,语料库,文本数据,自然语言处理,语言学,词汇分析,文本挖掘,机器学习 数据概述: 该数据集收录了来自印尼语语料库 Nusantara (Korpus Nusantara)...
    packageimg
  • 英国广播公司BBC2017年新闻文章文本数据集-aggle6666

    2025年4月23日   

    英国广播公司BBC2017年新闻文章文本数据集-aggle6666 数据来源:互联网公开数据 标签:新闻文章,BBC,文本数据,自然语言处理,NLP,文本挖掘,新闻,2017年,英国,媒体 数据概述: 本数据集包含了2017年从英国广播公司(BBC)新闻网站抓取的新闻文章。数据集提供了大量文本数据,涵盖了广泛的新闻主题。 数据用途概述:...
    packageimg
  • 孟加拉语维基百科文本数据集

    2025年4月23日   

    孟加拉语维基百科文本数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,机器学习,语言模型,文本挖掘 数据概述:...
    packageimg
  • 中文政治情感分析数据集PoliticalSentimentChineseDataset-charliegong

    2025年4月23日   

    中文政治情感分析数据集PoliticalSentimentChineseDataset-charliegong 数据来源:互联网公开数据 标签:情感分析,政治,数据集,文本挖掘,自然语言处理,机器学习,社会研究,舆论分析 数据概述: 该数据集包含来自中文互联网公开渠道的政治相关文本数据,记录了不同政治事件,政策或话题下的公众言论情感倾向。主要特征如下:...
    packageimg
  • 泰勒-斯威夫特推特数据集TaylorSwiftAllTweetsDataset-anshulbhardwaj0

    2025年4月23日   

    泰勒-斯威夫特推特数据集TaylorSwiftAllTweetsDataset-anshulbhardwaj0 数据来源:互联网公开数据 标签:社交媒体,数据集,推特分析,文本挖掘,情感分析,流行文化,机器学习,数据科学 数据概述: 该数据集包含来自社交媒体平台推特(Twitter)的数据,记录了知名歌手泰勒·斯威夫特发布的所有推文。主要特征如下:...
    packageimg
  • 新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword

    2025年4月23日   

    新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,自然语言处理,信息提取,舆情分析,媒体研究 数据概述: 该数据集包含来自各大新闻媒体和在线新闻平台的数据,记录了新闻文章,标题,发布时间,来源网站及关键词等信息。主要特征如下:...
    packageimg
  • 汉字华语处理句对数据集-yuweiiizz

    2025年4月23日   

    汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:...
    packageimg
  • 电影评论汇总数据集2023年夏季500条电影评论-lilianli17

    2025年4月23日   

    电影评论汇总数据集2023年夏季500条电影评论-lilianli17 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,文本挖掘,人工智能,电影研究,用户反馈 数据概述: 该数据集包含2023年夏季发布的500条电影评论,记录了观众对电影的评价和感受。主要特征如下: 时间跨度:数据记录的时间范围为2023年夏季。...
    packageimg
  • 恐怖主义与反恐主题推文数据集DatasetofTerrorismandAnti-terrorismTweets-shaileshkankarej2001

    2025年4月23日   

    恐怖主义与反恐主题推文数据集DatasetofTerrorismandAnti-terrorismTweets-shaileshkankarej2001 数据来源:互联网公开数据 标签:恐怖主义,反恐,推文分析,社交媒体,情感分析,文本挖掘,网络安全,机器学习 数据概述:...
    packageimg
  • 土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan

    2025年4月23日   

    土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,自然语言处理,机器学习,文本挖掘,土耳其语,恶意软件 数据概述: 该数据集包含来自土耳其的垃圾邮件和非垃圾邮件电子邮件数据,用于垃圾邮件检测和分类研究。主要特征如下:...
    packageimg
  • 基于BERT模型的网络情感分析数据集WebSentimentBERTR5V4Dataset-alonzorz

    2025年4月23日   

    基于BERT模型的网络情感分析数据集WebSentimentBERTR5V4Dataset-alonzorz 数据来源:互联网公开数据 标签:情感分析,自然语言处理,BERT,文本挖掘,数据集,机器学习,情感分类,社交媒体 数据概述: 该数据集包含了使用BERT模型进行情感分析的文本数据,主要用于训练和评估情感分类模型。主要特征如下:...
    packageimg
  • 推特情感分析数据集TwitterSentimentsDataset-asmikaboosarapu1234

    2025年4月23日   

    推特情感分析数据集TwitterSentimentsDataset-asmikaboosarapu1234 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,自然语言处理,文本挖掘,机器学习,舆情分析,情感识别 数据概述: 该数据集包含来自推特(Twitter)的文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 比特币情绪分析数据集BitcoinSentimentAnalysisDataset-chinmayquizizz

    2025年4月23日   

    比特币情绪分析数据集BitcoinSentimentAnalysisDataset-chinmayquizizz 数据来源:互联网公开数据 标签:比特币,情绪分析,社交媒体,金融,自然语言处理,文本挖掘,加密货币,市场预测 数据概述:...
    packageimg
  • 自然语言处理示例数据集NLPSampleData-fishercht

    2025年4月23日   

    自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:...
    packageimg
  • 文本摘要生成数据集SESummarizationDataset-rahulshelke98

    2025年4月23日   

    文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack...
    packageimg
  • 推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld

    2025年4月23日   

    推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld 数据来源:互联网公开数据 标签:推特,情绪分析,情感分析,自然语言处理,社交媒体,文本挖掘,机器学习,舆情分析 数据概述: 该数据集包含了来自推特平台的大量推文数据,用于情绪分析和情感分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc

    2025年4月23日   

    表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:...
    packageimg
  • 推特情感分析训练测试数据集TwitterSentimentsTrainingTestingDataset-mehargupta98

    2025年4月23日   

    推特情感分析训练测试数据集TwitterSentimentsTrainingTestingDataset-mehargupta98 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,社交媒体分析,人工智能 数据概述:...
    packageimg
  • BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika

    2025年4月23日   

    BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,信息检索,媒体研究,文本挖掘 数据概述: 该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章内容。主要特征如下:...
    packageimg
  • 邮件分析数据集EmailAnalysisDataset-sanjayyym

    2025年4月23日   

    邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:...
    packageimg