找到11,817个数据集

标签: 自然语言处理

过滤结果
  • BBC新闻数据集BBCNewsDataset-waqarahmed163

    2025年4月24日   

    BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13

    2025年4月24日   

    纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13 数据来源:互联网公开数据 标签:房地产,租赁,数据集,咨询,自然语言处理,机器学习,文本分析,纽约 数据概述: 该数据集包含来自纽约租赁房产的咨询数据,记录了租房者与房产经纪人之间的互动信息。主要特征如下:...
    packageimg
  • Netflix西班牙语影评数据集NetflixSpanishMovieandSeriesReviewsDataset-haroldsrivera

    2025年4月24日   

    Netflix西班牙语影评数据集NetflixSpanishMovieandSeriesReviewsDataset-haroldsrivera 数据来源:互联网公开数据 标签:影视评论,数据集,情感分析,自然语言处理,机器学习,娱乐行业,文本挖掘,用户反馈 数据概述:...
    packageimg
  • 电影类型预测数据集-abhikdhar

    2025年4月24日   

    电影类型预测数据集-abhikdhar 数据来源:互联网公开数据 标签:电影,类型,预测,数据集,机器学习,自然语言处理,文本分析,娱乐,影评 数据概述: 该数据集包含电影相关的文本数据,旨在用于电影类型的预测任务。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据主要来源于全球范围内的电影。...
    packageimg
  • 推文训练数据集Tweets-TrainDataset-priyankacheruku

    2025年4月24日   

    推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:...
    packageimg
  • 数据2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh

    2025年4月24日   

    2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh 数据来源:互联网公开数据 标签:多语言模型,自然语言处理,数据集,机器学习,文本标注,基准测试,人工智能,语言技术 数据概述: 该数据集由2025年大规模多语言模型基准(MMLM...
    packageimg
  • 讯飞农业领域数据集-xuyatian

    2025年4月24日   

    讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:...
    packageimg
  • 孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse

    2025年4月24日   

    孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,孟加拉语,文本分类,机器学习,情感识别,文本挖掘 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务,旨在识别和分类文本中的情感倾向。主要特征如下:...
    packageimg
  • Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni

    2025年4月24日   

    Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni 数据来源:互联网公开数据 标签:编程,数据集,Python,问答系统,自然语言处理,教育技术,机器学习,技术支持 数据概述: 该数据集包含来自互联网的Python编程相关的问答数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej

    2025年4月24日   

    H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:...
    packageimg
  • 股票新闻情绪分析数据集-ahmedashrafahmed

    2025年4月24日   

    股票新闻情绪分析数据集-ahmedashrafahmed 数据来源:互联网公开数据 标签:股票,新闻,情绪分析,自然语言处理,金融,文本挖掘,机器学习,投资 数据概述:该数据集包含来自互联网的股票新闻数据,记录了新闻标题,发布时间,新闻内容以及相应的情绪评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 姓名性别数据集Name-GenderDataset-shivanshpandeys

    2025年4月24日   

    姓名性别数据集Name-GenderDataset-shivanshpandeys 数据来源:互联网公开数据 标签:姓名分析,性别识别,数据集,文本处理,机器学习,自然语言处理,人口统计,数据分析 数据概述: 该数据集包含来自公开来源的姓名和性别数据,记录了不同姓名对应的性别信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,涵盖历史和现代姓名。...
    packageimg
  • 基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873

    2025年4月24日   

    基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:...
    packageimg
  • 越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002

    2025年4月24日   

    越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002 数据来源:互联网公开数据 标签:有害评论,文本分析,数据集,机器学习,自然语言处理,情感分析,语言技术,网络安全 数据概述: 该数据集包含来自越南语互联网平台的评论数据,记录了用户发布的有害内容,如仇恨言论,骚扰,歧视等。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002

    2025年4月24日   

    垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,分类算法,数据挖掘 数据概述: 该数据集包含来自公开邮件数据源的数据,记录了邮件内容及其分类标签(垃圾邮件或非垃圾邮件)。主要特征如下:...
    packageimg
  • 英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir

    2025年4月24日   

    英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,乌尔都语,英语,文本翻译,多语言 数据概述: 该数据集包含来自多个公开来源的英语到乌尔都语的平行语料,记录了双语句子对。主要特征如下:...
    packageimg
  • 信件特征数据集LettersFeaturesDataset-mingfengli1024

    2025年4月24日   

    信件特征数据集LettersFeaturesDataset-mingfengli1024 数据来源:互联网公开数据 标签:信件特征,数据集,文本分析,自然语言处理,机器学习,通信学,学术研究,邮件分类 数据概述:该数据集包含来自多个来源的信件特征数据,记录了不同信件的文本特征信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo

    2025年4月24日   

    奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo 数据来源:互联网公开数据 标签:奥斯卡,推文,社交媒体,情感分析,自然语言处理,电影,数据集,文本分析 数据概述: 该数据集包含来自Twitter的关于奥斯卡颁奖典礼的推文数据,记录了用户在颁奖典礼期间的实时互动和观点。主要特征如下:...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845

    2025年4月24日   

    中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845 数据来源:互联网公开数据 标签:自然语言处理,数学应用题,数据集,语义理解,机器阅读理解,人工智能,教育,文本分析 数据概述: 该数据集由台湾中央研究院(Academia...
    packageimg