找到11,854个数据集

标签: 自然语言处理

过滤结果
  • 合并简历数据集MergedResumeDataset-ginkog33

    2025年4月24日   

    合并简历数据集MergedResumeDataset-ginkog33 数据来源:互联网公开数据 标签:简历分析,数据集,自然语言处理,求职招聘,人力资源,数据分析,机器学习,人才库 数据概述: 该数据集包含了来自多个来源的合并简历数据,记录了求职者的详细信息,适用于简历分析,求职招聘等任务。主要特征如下:...
    packageimg
  • Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein

    2025年4月24日   

    Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein 数据来源:互联网公开数据 标签:社交媒体,书籍,讨论,数据集,文本分析,自然语言处理,情感分析,内容推荐 数据概述:...
    packageimg
  • 数据2020年美食数据集中的食物条目数据集-promptcloud

    2025年4月24日   

    2020年美食数据集中的食物条目数据集-promptcloud 数据来源:互联网公开数据 标签:美食,食物,数据集,餐饮业,图像识别,自然语言处理,数据挖掘,美食文化 数据概述: 该数据集包含来自2020年美食数据集的食物条目数据,记录了各种食物的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2020年。...
    packageimg
  • 情感分析社交媒体数据集SentimentAnalysisSocialMediaDataset-gauravsrivastav2507

    2025年4月24日   

    情感分析社交媒体数据集SentimentAnalysisSocialMediaDataset-gauravsrivastav2507 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,自然语言处理,机器学习,文本挖掘,社会媒体分析,文本分类...
    packageimg
  • 虚假新闻检测数据集BalancedFakeNewsDataset-arifkaggle979

    2025年4月24日   

    虚假新闻检测数据集BalancedFakeNewsDataset-arifkaggle979 数据来源:互联网公开数据 标签:虚假新闻,新闻检测,数据集,自然语言处理,文本分类,机器学习,信息真实性,舆情分析 数据概述: 该数据集包含了经过平衡处理的真实新闻和虚假新闻数据,主要用于训练和评估虚假新闻检测模型。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi

    2025年4月24日   

    阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi 数据来源:互联网公开数据 标签:序列标注,自然语言处理,数据集,命名实体识别,机器学习,语言处理,NLP,文本分析 数据概述: 该数据集包含阿拉伯语的序列标注数据,采用IOB标注格式记录了文本中的命名实体。主要特征如下:...
    packageimg
  • Reddit电影评论数据集RedditMovieCommentsDataset-sergunow

    2025年4月24日   

    Reddit电影评论数据集RedditMovieCommentsDataset-sergunow 数据来源:互联网公开数据 标签:社交媒体,电影评论,数据集,自然语言处理,情感分析,文本挖掘,机器学习,数据挖掘 数据概述:该数据集包含来自Reddit平台的用户对电影的评论数据,记录了用户对各类电影的评论内容和相关元数据。主要特征如下:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul

    2025年4月24日   

    Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul 数据来源:互联网公开数据 标签:在线教育,课程描述,数据集,自然语言处理,机器学习,教育技术,文本分析,课程分类 数据概述: 该数据集包含来自Udemy平台的课程描述数据,记录了2022年平台上部分课程的详细信息。主要特征如下:...
    packageimg
  • 增强版Fairseq模型训练数据集-arinaruck

    2025年4月24日   

    增强版Fairseq模型训练数据集-arinaruck 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,文本生成,数据集,深度学习,Fairseq,模型训练,人工智能 数据概述: 该数据集是用于训练和评估增强版Fairseq模型的文本数据集合,旨在提升模型在自然语言处理任务中的性能。主要特征如下: 时间跨度:...
    packageimg
  • 模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67

    2025年4月24日   

    模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源:互联网公开数据 标签:模糊匹配,相似度分析,数据集,自然语言处理,文本匹配,文本处理,数据清洗,人工智能 数据概述: 该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果,记录了不同文本字符串之间的相似度分数。主要特征如下:...
    packageimg
  • IMDB电影评论数据集2011-2017年-ivancanepa

    2025年4月24日   

    IMDB电影评论数据集2011-2017年-ivancanepa 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本分析,娱乐研究,社会学 数据概述:该数据集包含来自IMDB的50,000条电影评论,记录了用户对电影的感受和评价。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2017年。...
    packageimg
  • 韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub

    2025年4月24日   

    韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub 数据来源:互联网公开数据 标签:文本到SQL,自然语言处理,数据集,数据库,语义解析,机器学习,韩国语,代码生成 数据概述: 该数据集包含韩国语文本及其对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-SQL)生成模型。主要特征如下:...
    packageimg
  • Ankit推理数据集AnkitInferenceDataset-andysama79

    2025年4月24日   

    Ankit推理数据集AnkitInferenceDataset-andysama79 数据来源:互联网公开数据 标签:推理,数据集,自然语言处理,机器学习,文本分析,人工智能,深度学习,语言模型 数据概述: 该数据集包含来自Ankit项目的推理数据,记录了用于训练和评估自然语言处理模型的文本数据。主要特征如下:...
    packageimg
  • 巴西BuzzFeed点击诱饵标题数据集-rogeriochaves

    2025年4月24日   

    巴西BuzzFeed点击诱饵标题数据集-rogeriochaves 数据来源:互联网公开数据 标签:点击诱饵,巴西,BuzzFeed,标题,自然语言处理,文本分析,社交媒体,内容创作 数据概述: 该数据集包含了来自巴西BuzzFeed网站的点击诱饵标题数据,旨在研究和分析巴西葡萄牙语环境下的标题生成和内容传播规律。主要特征如下:...
    packageimg
  • 职位描述预测工作类型分类数据集-adarshsng

    2025年4月24日   

    职位描述预测工作类型分类数据集-adarshsng 数据来源:互联网公开数据 标签:职位描述,工作类型,自然语言处理,文本分类,机器学习,招聘,职业分析,数据挖掘 数据概述:该数据集包含来自招聘网站的职位描述数据,记录了不同职位的详细信息,用于预测工作类型分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了较长时期的招聘信息。...
    packageimg
  • 论辩训练数据集ArgumentTrainingDataset-wcqyfly

    2025年4月24日   

    论辩训练数据集ArgumentTrainingDataset-wcqyfly 数据来源:互联网公开数据 标签:自然语言处理,文本分类,论辩分析,机器学习,情感分析,文本挖掘,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的论辩文本数据,记录了不同主题的论辩内容和相关特征。主要特征如下:...
    packageimg
  • Flipkart产品评论情感分析数据集FlipkartDatasetforSentimentAnalysis-rohankulakarni

    2025年4月24日   

    Flipkart产品评论情感分析数据集FlipkartDatasetforSentimentAnalysis-rohankulakarni 数据来源:互联网公开数据 标签:产品评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,商业智能,电商分析 数据概述:...
    packageimg
  • 自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus

    2025年4月24日   

    自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:...
    packageimg
  • 英语阅读理解数据集RAGEnglishReadingComprehensionDataset-saadtahmid

    2025年4月24日   

    英语阅读理解数据集RAGEnglishReadingComprehensionDataset-saadtahmid 数据来源:互联网公开数据 标签:英语阅读,数据集,自然语言处理,机器学习,文本理解,学术研究,语言学习,教育...
    packageimg