找到5,810个数据集

标签: 文本分析

过滤结果
  • 古兰经相似经文语义搜索数据集QuranSimilarVersesSemanticSimilaritySearchDataset-omarrelsayeed

    2025年4月24日   

    古兰经相似经文语义搜索数据集QuranSimilarVersesSemanticSimilaritySearchDataset-omarrelsayeed 数据来源:互联网公开数据 标签:古兰经,语义相似性,数据集,自然语言处理,文本分析,宗教研究,文化分析,机器学习...
    packageimg
  • 欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb

    2025年4月24日   

    欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器翻译,语言学,NLP,欧洲议会 数据概述: 该数据集包含来自欧洲议会会议记录的文本数据,专注于命名实体识别任务。主要特征如下:...
    packageimg
  • 大阪夏季数据科学研讨会评论数据集DataScienceOsakaSummer2024CommentDataset-uedayuya

    2025年4月24日   

    大阪夏季数据科学研讨会评论数据集DataScienceOsakaSummer2024CommentDataset-uedayuya 数据来源:互联网公开数据 标签:数据科学,研讨会,评论,文本分析,自然语言处理,情感分析,机器学习,大阪 数据概述:...
    packageimg
  • 俄罗斯推特情感分析数据集RussianTwitterSentimentDataset-thorinhood

    2025年4月24日   

    俄罗斯推特情感分析数据集RussianTwitterSentimentDataset-thorinhood 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,机器学习,自然语言处理,数据挖掘,情感计算,文本分析 数据概述:...
    packageimg
  • 聊天机器人数据集50000条初始月份推文数据集ChatGPTDataset50000TweetsfromInitialMonth-maaz4465081

    2025年4月24日   

    聊天机器人数据集50000条初始月份推文数据集ChatGPTDataset50000TweetsfromInitialMonth-maaz4465081 数据来源:互联网公开数据 标签:聊天机器人,社交媒体,数据集,自然语言处理,文本分析,机器学习,人工智能,情感分析 数据概述:...
    packageimg
  • 华为自然语言处理公开数据集NLP-tttrrraaahhh

    2025年4月24日   

    华为自然语言处理公开数据集NLP-tttrrraaahhh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器翻译,情感分析,文本分类,华为,NLP 数据概述: 该数据集由华为公司发布,包含了多种自然语言处理任务的公开数据集,旨在促进NLP领域的研究与发展。主要特征如下: 时间跨度: 数据发布时间跨度不定,涵盖不同年份的数据。...
    packageimg
  • 新冠疫情月度推文数据集COVID-19RelatedTweetsMonthlyDataset-varrrrsha

    2025年4月24日   

    新冠疫情月度推文数据集COVID-19RelatedTweetsMonthlyDataset-varrrrsha 数据来源:互联网公开数据 标签:新冠疫情,推文,社交媒体,数据集,文本分析,情感分析,自然语言处理,疫情传播 数据概述: 该数据集包含来自Twitter的与新冠疫情相关推文数据,记录了用户在社交媒体上对疫情的讨论和观点。主要特征如下:...
    packageimg
  • 预处理推文数据集PreprocessedTweetsDataset-dv1453

    2025年4月24日   

    预处理推文数据集PreprocessedTweetsDataset-dv1453 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,信息提取 数据概述: 该数据集包含来自社交媒体平台预处理后的推文数据,记录了用户发布的推文文本及相关信息。主要特征如下:...
    packageimg
  • 问答对拆分训练数据集SplittedTrainQ-ADataset-thimkth

    2025年4月24日   

    问答对拆分训练数据集SplittedTrainQ-ADataset-thimkth 数据来源:互联网公开数据 标签:问答对,数据集,自然语言处理,文本分析,机器学习,知识图谱,文本挖掘,信息检索 数据概述: 该数据集包含拆分后的问答对数据,主要用于训练和评估自然语言处理模型。主要特征如下: 时间跨度:数据记录时间不限。...
    packageimg
  • kompas-articles-full-text-category-link-time数据集Kompas新闻文章全文本分类链接时间数据集-yusriyahim

    2025年4月24日   

    kompas-articles-full-text-category-link-time数据集Kompas新闻文章全文本分类链接时间数据集-yusriyahim 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,分类,机器学习,自然语言处理,媒体研究,时间序列 数据概述:...
    packageimg
  • Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor

    2025年4月24日   

    Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:计算机科学,数据集,文本分析,英文单词,操作系统,软件工程,自然语言处理,信息检索 数据概述: 该数据集包含来自 Linux 系统的英文单词列表,记录了 Linux 操作系统中所包含的常用英文单词。主要特征如下:...
    packageimg
  • 商品类别预测NLP应用数据集NLPforPredictingCategoriesofItemsDataset-shivam1298

    2025年4月24日   

    商品类别预测NLP应用数据集NLPforPredictingCategoriesofItemsDataset-shivam1298 数据来源:互联网公开数据 标签:自然语言处理,商品分类,数据集,文本分析,机器学习,零售业,人工智能,数据挖掘 数据概述:...
    packageimg
  • 土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin

    2025年4月24日   

    土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,文化,艺术,土耳其,文本分析,自然语言处理,舆情分析,数据集 数据概述: 该数据集包含来自土耳其国家广播电视台TRT Haber的文化艺术新闻数据,记录了TRT...
    packageimg
  • 阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled

    2025年4月24日   

    阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:...
    packageimg
  • 文本分类训练数据集CorpusCategoriasTreino-brunocomitre

    2025年4月24日   

    文本分类训练数据集CorpusCategoriasTreino-brunocomitre 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,分类任务,文本分析,葡萄牙语,训练集 数据概述: 该数据集包含了用于文本分类任务的葡萄牙语文本数据。主要特征如下: 时间跨度:数据未明确标注具体时间范围,但主要包含当代文本。...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-chiraayupravin

    2025年4月24日   

    自然语言处理项目数据集NLPProjectDataset-chiraayupravin 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,数据挖掘,文本分类 数据概述: 该数据集为自然语言处理项目的一部分,主要记录了用于文本分析,语言模型训练等任务的数据。主要特征如下:...
    packageimg
  • Reddit社区评论文本与参数数据集-takeshiiijima

    2025年4月24日   

    Reddit社区评论文本与参数数据集-takeshiiijima 数据来源:互联网公开数据 标签:社交媒体,Reddit,评论,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自Reddit社区的评论数据,并附有相应的文本参数。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于Reddit公开数据的获取时间范围。...
    packageimg
  • 自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg

    2025年4月24日   

    自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg 数据来源:互联网公开数据 标签:自然语言处理,词袋模型,数据集,文本分类,机器学习,文本分析,数据挖掘,信息检索 数据概述: 该数据集包含自然语言处理中词袋模型的提交数据,记录了文本分类,关键词提取等任务的样本和标签。主要特征如下:...
    packageimg
  • 统计学专业毕业论文数据集数据集-tirtainovan

    2025年4月24日   

    统计学专业毕业论文数据集数据集-tirtainovan 数据来源:互联网公开数据 标签:统计学,毕业论文,数据集,文本分析,学术研究,自然语言处理,论文写作,学术资源 数据概述: 该数据集包含统计学专业毕业论文的文本数据,旨在为学术研究和数据分析提供支持。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来统计学专业毕业论文。...
    packageimg
  • 自然语言处理NLP最终项目数据集-prasadmagdum

    2025年4月24日   

    自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。...
    packageimg