找到11,811个数据集

标签: 自然语言处理

过滤结果
  • arXiv论文分类数据集-ahmedcoolprojects

    2025年4月24日   

    arXiv论文分类数据集-ahmedcoolprojects 数据来源:互联网公开数据 标签:学术论文,arXiv,分类,自然语言处理,机器学习,文本挖掘,科研,数据集 数据概述: 该数据集包含了来自arXiv预印本服务器的学术论文数据,这些论文已按照不同的类别进行组织。主要特征如下:...
    packageimg
  • 新闻分类数据集AgNewsClassificationDataset-jatinsareen

    2025年4月24日   

    新闻分类数据集AgNewsClassificationDataset-jatinsareen 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,文本分析,机器学习,深度学习,文本挖掘,信息检索 数据概述:该数据集包含来自Ag News的数据,记录了各类新闻文章的标题和内容,适用于新闻分类和文本分析任务。主要特征如下:...
    packageimg
  • 职位描述数据分析数据集JobDescriptionsDataset-magantiit

    2025年4月24日   

    职位描述数据分析数据集JobDescriptionsDataset-magantiit 数据来源:互联网公开数据 标签:人力资源,数据集,职位分析,文本挖掘,机器学习,招聘管理,职业发展,自然语言处理 数据概述: 该数据集包含来自多个招聘平台和企业的职位描述数据,记录了不同行业和岗位的职位要求,职责描述,任职资格等信息。主要特征如下:...
    packageimg
  • 数据2023年医学多选题问答数据集Kalapa2023MedMCQADataset-thien1

    2025年4月24日   

    2023年医学多选题问答数据集Kalapa2023MedMCQADataset-thien1 数据来源:互联网公开数据 标签:医学,多选题,数据集,机器学习,自然语言处理,健康科学,教育,人工智能 数据概述:该数据集包含2023年采集的医学多选题问答数据,适用于医学教育,自然语言处理和机器学习等领域。主要特征如下:...
    packageimg
  • 课程评价数据集CourseReviewsDataset-brahimerkan

    2025年4月24日   

    课程评价数据集CourseReviewsDataset-brahimerkan 数据来源:互联网公开数据 标签:教育,数据分析,机器学习,用户反馈,课程评价,自然语言处理,教学质量,在线教育 数据概述:该数据集包含来自在线教育平台的课程评价数据,记录了用户对课程的评价内容,评分及相关信息。主要特征如下:...
    packageimg
  • 阿拉伯语情感分析数据集-ouaraskhelilrafik

    2025年4月24日   

    阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。...
    packageimg
  • 情绪识别多轮对话数据集MELD多轮对话情绪识别数据集-va6573

    2025年4月24日   

    情绪识别多轮对话数据集MELD多轮对话情绪识别数据集-va6573 数据来源:互联网公开数据 标签:情绪识别,多轮对话,数据集,自然语言处理,机器学习,对话系统,心理学,情感分析 数据概述:该数据集包含来自 MELD(Multimodal Emotion Lines Dataset)项目的多轮对话数据,记录了对话中的情绪变化。主要特征如下:...
    packageimg
  • 孟加拉语仇恨言论与俚语数据集-arkabhattachajee01

    2025年4月24日   

    孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。...
    packageimg
  • 迁都情绪数据集SentimentDatasetforPemindahanIbukotaIKN-alamrrr

    2025年4月24日   

    迁都情绪数据集SentimentDatasetforPemindahanIbukotaIKN-alamrrr 数据来源:互联网公开数据 标签:情绪分析,数据集,迁都,社会情绪,自然语言处理,社会研究,政治分析,公共政策 数据概述:该数据集包含来自社交媒体和新闻媒体关于迁都(Pemindahan Ibukota...
    packageimg
  • 亚马逊商品文本数据提取数据集AmazonProductTextDataExtractionDataset-sahilsasane

    2025年4月24日   

    亚马逊商品文本数据提取数据集AmazonProductTextDataExtractionDataset-sahilsasane 数据来源:互联网公开数据 标签:电子商务,文本分析,数据集,自然语言处理,机器学习,商品信息,数据挖掘,商业智能 数据概述: 该数据集包含来自亚马逊平台的商品文本数据,记录了亚马逊网站上各类商品的详细信息。主要特征如下:...
    packageimg
  • 开放图片描述数据集CaptionsDatasetPublic-mahipalimkar

    2025年4月24日   

    开放图片描述数据集CaptionsDatasetPublic-mahipalimkar 数据来源:互联网公开数据 标签:图像描述,自然语言处理,计算机视觉,数据集,文本生成,图像识别,多模态学习,人工智能 数据概述: 该数据集包含了大量图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
    packageimg
  • 英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608

    2025年4月24日   

    英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,机器学习,文本分类,信息检索,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本,涵盖多个新闻类别。主要特征如下:...
    packageimg
  • 临床病历与诊断预测数据集ClinicalNotesandDiagnosisPredictionDataset-noorsaeed

    2025年4月24日   

    临床病历与诊断预测数据集ClinicalNotesandDiagnosisPredictionDataset-noorsaeed 数据来源:互联网公开数据 标签:医疗健康,临床诊断,数据集,自然语言处理,机器学习,疾病预测,医疗分析,人工智能 数据概述:...
    packageimg
  • 数据2021年Trustpilot网站用户评论数据集-mattiaottoborgo

    2025年4月24日   

    2021年Trustpilot网站用户评论数据集-mattiaottoborgo 数据来源:互联网公开数据 标签:用户评论,消费者评价,数据集,情感分析,自然语言处理,文本挖掘,服务质量,在线声誉 数据概述: 该数据集包含了来自Trustpilot网站的2021年度用户评论数据,记录了用户对各类商家和服务的评价信息。主要特征如下:...
    packageimg
  • 文本蕴含关系数据集SNLI

    2025年4月24日   

    文本蕴含关系数据集SNLI 数据来源:互联网公开数据 标签:文本蕴含,自然语言处理,语义分析,分类任务,训练数据,深度学习,机器学习 数据概述: 本数据集基于SNLI(Stanford Natural Language...
    packageimg
  • 大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57

    2025年4月24日   

    大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:...
    packageimg
  • 技术人才招聘与正则表达式应用数据集TechTalentRecruitingwithRegexDataset-abdelazizsami

    2025年4月24日   

    技术人才招聘与正则表达式应用数据集TechTalentRecruitingwithRegexDataset-abdelazizsami 数据来源:互联网公开数据 标签:技术招聘,正则表达式,数据集,人才分析,文本处理,机器学习,人力资源,自然语言处理...
    packageimg
  • IT职位描述数据集

    2025年4月24日   

    IT职位描述数据集 数据来源:互联网公开数据 标签:IT行业,职位描述,数据驱动经济,招聘分析,职位匹配,自然语言处理 数据概述:...
    packageimg
  • 社交媒体情绪与气候变化数据集

    2025年4月24日   

    社交媒体情绪与气候变化数据集 数据来源:互联网公开数据 标签:社交媒体情绪,气候变化,自然语言处理,情感分析,时间序列,趋势研究,政策影响 数据概述...
    packageimg
  • 数据17k酒店评论数据集17kHotelReviewsDataset-adityadatta1234

    2025年4月24日   

    17k酒店评论数据集17kHotelReviewsDataset-adityadatta1234 数据来源:互联网公开数据 标签:酒店评论,数据集,文本分析,情感分析,自然语言处理,旅游行业,机器学习,消费者行为 数据概述: 该数据集包含来自17,000多条酒店评论的数据,记录了消费者对酒店服务的评价和反馈。主要特征如下:...
    packageimg