找到5,801个数据集

标签: 文本分析

过滤结果
  • 泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja

    2025年5月30日   

    泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja 数据来源:互联网公开数据 标签:维基百科,泰卢固语,文本分析,自然语言处理,数据集,语言学,信息检索,文本挖掘 数据概述: 该数据集包含来自泰卢固语维基百科的文章数据,记录了泰卢固语维基百科中所有文章的详细信息。主要特征如下:...
    packageimg
  • 印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon

    2025年5月30日   

    印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon 数据来源:互联网公开数据 标签:新闻头条,数据集,自然语言处理,文本分析,情感分析,机器学习,信息检索,媒体研究 数据概述:该数据集包含来自印度主要新闻媒体的新闻头条数据,记录了不同时间段的新闻标题。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2022年。...
    packageimg
  • 新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva

    2025年5月30日   

    新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva 数据来源:互联网公开数据 标签:文本摘要, 新闻文章, 自然语言处理, 文本生成, 机器翻译, 数据集, 深度学习, 文本分析 数据概述: 该数据集包含来自新闻网站的英文新闻文章及其对应的标题和摘要,主要用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 自然语言处理聊天机器人数据集NLPChatbotData-shekhartiruwa25

    2025年5月30日   

    自然语言处理聊天机器人数据集NLPChatbotData-shekhartiruwa25 数据来源:互联网公开数据 标签:自然语言处理,聊天机器人,数据集,对话系统,机器学习,文本分析,人工智能,语言模型 数据概述: 该数据集包含来自公开来源的自然语言处理聊天机器人对话数据,记录了用户与聊天机器人的交互内容。主要特征如下:...
    packageimg
  • 新冠疫情新闻真伪辨别数据集COVID-19NewsClaimVerification-totalcrazy

    2025年5月30日   

    新冠疫情新闻真伪辨别数据集COVID-19NewsClaimVerification-totalcrazy 数据来源:互联网公开数据 标签:疫情, 新冠, 新闻, 真伪辨别, 文本分析, 图像分析, 文本分类, 多模态 数据概述: 该数据集包含来自社交媒体和新闻网站的新冠疫情相关新闻声明及其对应的佐证文档,用于进行新闻真伪辨别任务。主要特征如下:...
    packageimg
  • 越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl

    2025年5月30日   

    越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl 数据来源:互联网公开数据 标签:越南语,情感分析,社交媒体,数据集,自然语言处理,文本分析,机器学习,NLP 数据概述: 该数据集包含了来自越南社交媒体平台的用户文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer

    2025年5月30日   

    互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,社会研究,媒体研究,信息学 数据概述:该数据集由多个互联网新闻来源整合而成,记录了广泛范围内的新闻文章内容。主要特征如下:...
    packageimg
  • COVID-19疫情文献分析数据集COVID-19PandemicLiteratureAnalysis-houssemayed

    2025年5月30日   

    COVID-19疫情文献分析数据集COVID-19PandemicLiteratureAnalysis-houssemayed 数据来源:互联网公开数据 标签:COVID-19, 疫情, 医学文献, 文本分析, 疾病传播, 流行病学, 数据挖掘, 自然语言处理 数据概述:...
    packageimg
  • 政治新闻文本分类数据集PoliticalNewsTextClassificationDataset-shwe1308

    2025年5月30日   

    政治新闻文本分类数据集PoliticalNewsTextClassificationDataset-shwe1308 数据来源:互联网公开数据 标签:新闻文本, 政治, 分类, 文本分析, 时事, 机器学习, 自然语言处理, 舆情分析 数据概述: 该数据集包含来自新闻网站的政治新闻文章,记录了文章的标题、正文、主题、发布日期和标签。主要特征如下:...
    packageimg
  • 坦帕与图森城市评论数据集TampaandTucsonReviewsDataset-reisdrj

    2025年5月30日   

    坦帕与图森城市评论数据集TampaandTucsonReviewsDataset-reisdrj 数据来源:互联网公开数据 标签:城市评论,消费者反馈,数据集,社会研究,文本分析,机器学习,市场研究,用户体验 数据概述: 该数据集包含来自坦帕和图森两个城市的消费者评论数据,记录了用户对本地企业、服务或景点的评价信息。主要特征如下:...
    packageimg
  • Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale

    2025年5月30日   

    Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale 数据来源:互联网公开数据 标签:社交网络,文本嵌入,数据集,自然语言处理,机器学习,情感分析,用户行为,文本分析 数据概述:...
    packageimg
  • YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx

    2025年5月30日   

    YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx 数据来源:互联网公开数据 标签:自然语言处理,数据集,越南语,文本分析,机器学习,情感分析,社交媒体,多语言处理 数据概述: 该数据集包含来自YouTube平台的越南语评论数据,记录了用户对视频内容的评论信息。主要特征如下:...
    packageimg
  • 文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner

    2025年5月30日   

    文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner 数据来源:互联网公开数据 标签:文本连贯性, 自然语言处理, 伪标签, 文本分析, 机器学习, 文本特征, 语篇分析, 模型预测 数据概述:...
    packageimg
  • 问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid

    2025年5月30日   

    问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid 数据来源:互联网公开数据 标签:问答系统, 文本分析, 质量评估, 机器学习, 自然语言处理, 深度学习, 模型训练, 预测 数据概述: 该数据集包含用于评估问答对质量的结构化数据,主要用于训练和测试问答质量评估模型。主要特征如下:...
    packageimg
  • 乌克兰公共采购推荐系统数据集ZakupkiHackRecSysDataset-mrmorj

    2025年5月30日   

    乌克兰公共采购推荐系统数据集ZakupkiHackRecSysDataset-mrmorj 数据来源:互联网公开数据 标签:采购数据,推荐系统,机器学习,乌克兰,公共部门,文本分析,数据集,自然语言处理 数据概述: 该数据集源于乌克兰公共采购平台 Zakupki.Pro,记录了乌克兰公共部门的采购信息,主要用于构建推荐系统。主要特征如下:...
    packageimg
  • 众筹项目文本与结果分析数据集CrowdfundingProjectTextandOutcomeAnalysis-antonionoca

    2025年5月30日   

    众筹项目文本与结果分析数据集CrowdfundingProjectTextandOutcomeAnalysis-antonionoca 数据来源:互联网公开数据 标签:众筹,项目分析,文本分析,项目状态,自然语言处理,文本特征,项目成功率,机器学习 数据概述:...
    packageimg
  • 维基百科STEM领域文章数据集Wiki17kSTEMArticlesDataset-manchvictor

    2025年5月30日   

    维基百科STEM领域文章数据集Wiki17kSTEMArticlesDataset-manchvictor 数据来源:互联网公开数据 标签:维基百科,STEM,数据集,文本分析,自然语言处理,机器学习,学术资源,科学教育 数据概述:该数据集包含来自维基百科的STEM领域文章,记录了17000多篇与科学、技术、工程和数学相关的内容。主要特征如下:...
    packageimg
  • 基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather

    2025年5月30日   

    基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather 数据来源:互联网公开数据 标签:自然语言处理,文本分析,论文写作,深度学习,BERT,数据集,文本嵌入,学术研究 数据概述: 该数据集包含了使用BERT模型生成的论文嵌入向量,旨在为论文写作、文本分析等任务提供支持。主要特征如下:...
    packageimg
  • 语言模型系统大规模数据集LMSys72KDataset-qinhaoyang

    2025年5月30日   

    语言模型系统大规模数据集LMSys72KDataset-qinhaoyang 数据来源:互联网公开数据 标签:语言模型,自然语言处理,数据集,机器学习,文本分析,人工智能,大数据,文本生成 数据概述: 该数据集由LMSys项目提供,包含大规模的文本数据,适用于语言模型训练、自然语言处理及文本生成等任务。主要特征如下:...
    packageimg
  • 文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie

    2025年5月30日   

    文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,信息提取 数据概述: 该数据集包含来自多个来源的文本数据,记录了各类文本内容及其相关属性。主要特征如下:...
    packageimg