找到5,810个数据集

标签: 文本分析

过滤结果
  • 土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin

    2025年4月24日   

    土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,健康,数据集,土耳其,文本分析,自然语言处理,医疗信息,机器学习 数据概述: 该数据集包含来自土耳其公开渠道的健康相关新闻文章,记录了与健康,医疗,公共卫生等主题相关的新闻报道。主要特征如下:...
    packageimg
  • 新闻摘要数据集NewsSummaryDataset-usmannwaheed

    2025年4月24日   

    新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。...
    packageimg
  • 反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk

    2025年4月24日   

    反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,数据集,语义理解,情感识别,深度学习 数据概述: 该数据集包含来自社交媒体和在线评论的反讽文本数据,记录了包含反讽表达的文本及其对应的嵌入表示。主要特征如下:...
    packageimg
  • 英国航空公司旅客评价数据集BritishAirwaysAirlineReviewsDataset-dinanabil811

    2025年4月24日   

    英国航空公司旅客评价数据集BritishAirwaysAirlineReviewsDataset-dinanabil811 数据来源:互联网公开数据 标签:航空业,旅客评价,数据集,客户满意度,文本分析,机器学习,情感分析,商业智能 数据概述: 该数据集包含来自英国航空公司的旅客评价数据,记录了旅客对英国航空服务的反馈和评价。主要特征如下:...
    packageimg
  • 翻译数据集TranslatedDataset-waelfezari

    2025年4月24日   

    翻译数据集TranslatedDataset-waelfezari 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,文本分析,语言学,多语言,深度学习,文本对齐 数据概述: 该数据集包含多种语言的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的创建时间。...
    packageimg
  • 词向量模型数据集GloVe-mlethics

    2025年4月24日   

    词向量模型数据集GloVe-mlethics 数据来源:互联网公开数据 标签:词向量,自然语言处理,文本分析,机器学习,深度学习,语义分析,词嵌入,NLP 数据概述: 该数据集包含了由斯坦福大学开发的GloVe(Global Vectors for Word Representation)词向量模型。主要特征如下:...
    packageimg
  • 增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365

    2025年4月24日   

    增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本增强,数据扩充,机器学习,深度学习,文本分析,NLP 数据概述: 该数据集包含增强的自然语言处理(NLP)数据,旨在提升NLP模型的性能和鲁棒性。主要特征如下: 时间跨度:...
    packageimg
  • 翻译项目CSV数据集TranslatedCSVDataset-ahensetihom

    2025年4月24日   

    翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:...
    packageimg
  • 多类别短信数据集MulticlassSMSDataset-sahanr

    2025年4月24日   

    多类别短信数据集MulticlassSMSDataset-sahanr 数据来源:互联网公开数据 标签:短信分类,数据集,自然语言处理,机器学习,文本分析,情感分析,通信技术,文本分类 数据概述: 该数据集包含来自公开来源的短信数据,记录了不同类别的短信内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • 航空公司旅客评价数据集AirlinePassengerReviewsDataset-tahayna

    2025年4月24日   

    航空公司旅客评价数据集AirlinePassengerReviewsDataset-tahayna 数据来源:互联网公开数据 标签:航空业,旅客评价,数据集,文本分析,情感分析,机器学习,自然语言处理,客户服务 数据概述: 该数据集包含来自各大航空公司的旅客评价数据,记录了乘客对航空服务的反馈和评分。主要特征如下:...
    packageimg
  • 维基百科数据集DCWikiDataCSV-jungwoonseok

    2025年4月24日   

    维基百科数据集DCWikiDataCSV-jungwoonseok 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,学术资源,知识图谱 数据概述:该数据集包含来自维基百科的数据,记录了大量维基百科页面的内容和属性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad

    2025年4月24日   

    垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad 数据来源:互联网公开数据 标签:垃圾邮件检测,数据集,电子邮件分析,机器学习,信息过滤,网络安全,数据科学,文本分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,用于垃圾邮件检测任务。主要特征如下:...
    packageimg
  • 推特情感分析数据集TwitterTaperaDataset-unshoytable

    2025年4月24日   

    推特情感分析数据集TwitterTaperaDataset-unshoytable 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,机器学习,社会媒体,文本分析,人工智能 数据概述:该数据集包含来自推特的文本数据,记录了用户发表的推文及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • Reddit烹饪论坛讨论数据RedditCookForumDiscussionData-vaishnavibv

    2025年4月24日   

    Reddit烹饪论坛讨论数据RedditCookForumDiscussionData-vaishnavibv 数据来源:互联网公开数据 标签:烹饪,论坛,Reddit,文本分析,自然语言处理,情感分析,社交媒体,饮食 数据概述:该数据集包含来自Reddit烹饪论坛(r/Cooking)的讨论数据,记录了用户发布的帖子,评论及其相关信息。主要特征如下:...
    packageimg
  • 乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani

    2025年4月24日   

    乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,罗马转写,文本分析,机器学习,语言学,文本数据,情感分析 数据概述: 该数据集包含乌尔都语的罗马转写文本数据,记录了用罗马字母书写的乌尔都语内容。主要特征如下:...
    packageimg
  • 新冠疫情期间推特数据分析数据集COVID-19TwitterDataAnalysisDataset-tejaswini336

    2025年4月24日   

    新冠疫情期间推特数据分析数据集COVID-19TwitterDataAnalysisDataset-tejaswini336 数据来源:互联网公开数据 标签:新冠疫情,推特数据,社交媒体,文本分析,情感分析,疫情传播,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • 电商产品信息链接数据集-samksoon

    2025年4月24日   

    电商产品信息链接数据集-samksoon 数据来源:互联网公开数据 标签:电商,产品信息,数据集,链接分析,网络爬虫,文本分析,数据挖掘,市场研究 数据概述: 该数据集包含了来自电商平台的产品信息链接,记录了各种产品的详细信息。主要特征如下: 时间跨度: 数据记录的时间范围,随数据源更新而变化。 地理范围: 数据覆盖的区域,主要为电商平台所涉及的地区。...
    packageimg
  • 自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg

    2025年4月24日   

    自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg 数据来源:互联网公开数据 标签:自然语言处理,SpaCy,Python编程,数据集,文本分析,机器学习,语言模型,计算语言学 数据概述:...
    packageimg
  • 外部数据有害评论数据集ExternalDataToxicCommentsDataset-roshanvelpula

    2025年4月24日   

    外部数据有害评论数据集ExternalDataToxicCommentsDataset-roshanvelpula 数据来源:互联网公开数据 标签:数据集,文本分析,情感分析,自然语言处理,机器学习,网络安全,数据挖掘,社交媒体 数据概述: 该数据集包含来自外部来源的有害评论数据,记录了网络平台上的评论内容及其标签。主要特征如下:...
    packageimg
  • 中国人民大学文本聚类数据集RUCTextClusteringDataset-spiritwalk

    2025年4月24日   

    中国人民大学文本聚类数据集RUCTextClusteringDataset-spiritwalk 数据来源:互联网公开数据 标签:文本分析,数据集,聚类算法,自然语言处理,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集由中国人民大学提供,专注于文本数据的聚类分析。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,推测为近年数据。...
    packageimg