找到11,858个数据集

标签: 自然语言处理

过滤结果
  • 客户编辑数据集Customer-EditedDataset-zoooooone

    2025年4月25日   

    客户编辑数据集Customer-EditedDataset-zoooooone 数据来源:互联网公开数据 标签:客户反馈,数据集,编辑内容,用户生成,数据处理,自然语言处理,客户服务,数据挖掘 数据概述: 该数据集包含来自多个在线平台和服务的客户编辑内容,记录了用户对产品,服务或内容的修改和编辑信息。主要特征如下: 时间跨度:...
    packageimg
  • 国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi

    2025年4月25日   

    国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi 数据来源:互联网公开数据 标签:论文引用,数据集,学术研究,文献计量学,网络分析,机器学习,自然语言处理,信息检索 数据概述:...
    packageimg
  • 呼叫中心通话记录数据集CallCentreDataset-jwilsh

    2025年4月25日   

    呼叫中心通话记录数据集CallCentreDataset-jwilsh 数据来源:互联网公开数据 标签:呼叫中心,通话记录,文本分析,情感分析,自然语言处理,客户服务,机器学习,语音识别 数据概述: 该数据集包含来自呼叫中心的通话记录数据,记录了客户与客服之间的对话内容。主要特征如下:...
    packageimg
  • 教育领域知识嵌入与混合数据集EEDIEMBEDMIXSILVERV3Dataset-conjuring92

    2025年4月25日   

    教育领域知识嵌入与混合数据集EEDIEMBEDMIXSILVERV3Dataset-conjuring92 数据来源:互联网公开数据 标签:教育技术,知识嵌入,混合数据集,机器学习,数据集,教育研究,深度学习,自然语言处理 数据概述: 该数据集由教育领域知识嵌入与混合项目(EEDI EMBED...
    packageimg
  • 内容推荐系统数据集Content-BasedRecommendationDataset-denizmac

    2025年4月25日   

    内容推荐系统数据集Content-BasedRecommendationDataset-denizmac 数据来源:互联网公开数据 标签:推荐系统,内容推荐,数据集,机器学习,用户行为,文本分析,信息检索,自然语言处理 数据概述:该数据集包含来自多个来源的用户内容互动数据,记录了用户与内容项之间的交互信息。主要特征如下:...
    packageimg
  • 谣言识别与评估数据集RumourEval-NewDataset-latapangteyy

    2025年4月25日   

    谣言识别与评估数据集RumourEval-NewDataset-latapangteyy 数据来源:互联网公开数据 标签:谣言识别,社交媒体,数据集,自然语言处理,文本分析,深度学习,信息传播,情感分析 数据概述:该数据集包含了来自社交媒体平台(如Twitter)的关于各种主题的谣言信息,旨在用于谣言的检测,评估和分析。主要特征如下:...
    packageimg
  • 土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin

    2025年4月25日   

    土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻分析,数据集,自然语言处理,文本分类,机器学习,新闻媒体,土耳其,多语言 数据概述: 该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据,记录了该媒体发布的新闻内容。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1

    2025年4月25日   

    电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,情感倾向,电影行业 数据概述:该数据集包含来自互联网的电影评论数据,主要用于情感分析任务,旨在识别电影评论中的情感倾向。主要特征如下:...
    packageimg
  • MTGA中文本地化数据集MTGAChineseLocalizationDataset-lieyanqzu

    2025年4月25日   

    MTGA中文本地化数据集MTGAChineseLocalizationDataset-lieyanqzu 数据来源:互联网公开数据 标签:游戏本地化,中文翻译,数据集,机器学习,自然语言处理,游戏开发,数据标注,人工智能 数据概述: 该数据集包含来自《万智牌竞技场》(Magic: The Gathering...
    packageimg
  • 双子星长文本数据集GeminiLongContextDataset-akinduhiman

    2025年4月25日   

    双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • Wisesight社交媒体情感分析数据集-yangyangaads

    2025年4月25日   

    Wisesight社交媒体情感分析数据集-yangyangaads 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本挖掘,自然语言处理,机器学习,泰国,情感分类,舆情分析 数据概述: 该数据集包含来自泰国社交媒体平台的数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了从过去到现在社交媒体上的数据。...
    packageimg
  • 文本清理数据集CleanedTextDataset-rahulk2197

    2025年4月25日   

    文本清理数据集CleanedTextDataset-rahulk2197 数据来源:互联网公开数据 标签:文本清理,数据集,自然语言处理,文本分析,机器学习,文本挖掘,数据预处理,语言学 数据概述:该数据集包含经过清理和标准化处理的文本数据,适用于自然语言处理和文本分析。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 电子邮件垃圾邮件检测数据集-salonimourya

    2025年4月25日   

    电子邮件垃圾邮件检测数据集-salonimourya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,自然语言处理,机器学习,信息检索,数据挖掘 数据概述: 该数据集包含电子邮件数据,用于垃圾邮件检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电子邮件产生的历史数据。...
    packageimg
  • 产品评论情感分析数据集ProductReviewSentimentAnalysisDataset-anutural

    2025年4月25日   

    产品评论情感分析数据集ProductReviewSentimentAnalysisDataset-anutural 数据来源:互联网公开数据 标签:产品评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,消费者行为,商业智能 数据概述: 该数据集包含来自电商平台的产品评论数据,记录了消费者对不同产品的评价内容及其情感倾向。主要特征如下:...
    packageimg
  • LIWC文本特征分析数据集LIWCFeaturesDataset-bimangiri

    2025年4月25日   

    LIWC文本特征分析数据集LIWCFeaturesDataset-bimangiri 数据来源:互联网公开数据 标签:文本分析,心理学,语言学,数据集,自然语言处理,情绪分析,情感计算,社交媒体 数据概述: 该数据集包含了使用语言调查和字数统计(LIWC)软件处理后的文本特征数据,用于分析文本中的心理,情绪和语言模式。主要特征如下: 时间跨度:...
    packageimg
  • 金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058

    2025年4月25日   

    金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058 数据来源:互联网公开数据 标签:情感分析,金融新闻,数据集,自然语言处理,机器学习,文本挖掘,金融科技,文本分类 数据概述:...
    packageimg
  • 钻井相关推文分析数据集Dril-TweetsDataset-jehant

    2025年4月25日   

    钻井相关推文分析数据集Dril-TweetsDataset-jehant 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,石油天然气,舆情监测,自然语言处理 数据概述: 该数据集包含与钻井相关的推文数据,记录了社交媒体上关于钻井行业的讨论和观点。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2020年。...
    packageimg
  • 数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun

    2025年4月25日   

    数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源:互联网公开数据 标签:自然语言处理,数据集,分词器,文本处理,机器学习,语言模型,数据预处理,工具集 数据概述: 该数据集包含用于自然语言处理的多种工具和数据集,主要支持文本分词,数据预处理等任务。主要特征如下:...
    packageimg
  • 幽默检测数据集HumorDetectionDataset-amaanmansuri

    2025年4月25日   

    幽默检测数据集HumorDetectionDataset-amaanmansuri 数据来源:互联网公开数据 标签:幽默检测,自然语言处理,数据集,机器学习,文本分析,情感识别,人工智能,语言学 数据概述: 该数据集包含来自多个互联网来源的文本数据,记录了不同形式的幽默内容及其标签,适用于幽默检测,文本情感分析等任务。主要特征如下:...
    packageimg
  • 金融合规性审查数据集FinCompliants10000-fernandobordi

    2025年4月25日   

    金融合规性审查数据集FinCompliants10000-fernandobordi 数据来源:互联网公开数据 标签:金融,合规,数据集,文本分析,自然语言处理,风险管理,监管科技,机器学习 数据概述: 该数据集包含金融领域内的合规性审查相关数据,旨在支持对金融机构的合规性风险评估和管理。主要特征如下:...
    packageimg