找到11,864个数据集

标签: 自然语言处理

过滤结果
  • 布尔问答数据集BoolQDataset-parthplc

    2025年4月25日   

    布尔问答数据集BoolQDataset-parthplc 数据来源:互联网公开数据 标签:布尔问答,自然语言处理,数据集,机器学习,文本分类,逻辑推理,人工智能,计算机科学 数据概述: 该数据集由斯坦福大学提供,主要记录了布尔问答的文本数据,适用于自然语言处理和逻辑推理研究。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2020年。...
    packageimg
  • TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika

    2025年4月25日   

    TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,语言学习,机器学习,自然语言处理,教育,心理学 数据概述: 该数据集包含来自TED官网的主要演讲内容数据,记录了 TED 演讲的详细信息和文本内容。主要特征如下:...
    packageimg
  • 新闻文本分类数据集-oussemahedri

    2025年4月25日   

    新闻文本分类数据集-oussemahedri 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,文本分析,数据集,新闻报道,中文 数据概述:该数据集包含来自互联网新闻网站的新闻文本数据,记录了不同类别新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn

    2025年4月25日   

    语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn 数据来源:互联网公开数据 标签:语音识别,自适应技术,数据集,自然语言处理,人工智能,机器学习,语音信号处理,教育技术 数据概述: 该数据集由AISHELL项目提供,专注于语音识别和自适应技术的应用。主要特征如下:...
    packageimg
  • 语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta

    2025年4月25日   

    语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta 数据来源:互联网公开数据 标签:语音识别,情感识别,数据集,中文,深度学习,自然语言处理,音频分析,机器学习 数据概述:...
    packageimg
  • 气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee

    2025年4月25日   

    气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗影像,气胸,MIMIC数据库,数据集,医学报告,深度学习,自然语言处理,临床研究 数据概述:...
    packageimg
  • 粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994

    2025年4月25日   

    粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994 数据来源:互联网公开数据 标签:社交媒体,评论分析,自然语言处理,数据集,粤语,情感分析,机器学习,文本挖掘 数据概述: 该数据集包含来自YouTube平台的粤语评论数据,记录了用户对视频内容的评论信息。主要特征如下:...
    packageimg
  • 楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov

    2025年4月25日   

    楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
    packageimg
  • 语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng

    2025年4月25日   

    语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng 数据来源:互联网公开数据 标签:人工智能,语言模型,数据生成,自然语言处理,机器学习,数据集,文本分析,智能生成 数据概述: 该数据集包含由语言模型和人工智能技术生成的文本数据,记录了通过先进AI模型生成的各种类型文本内容。主要特征如下:...
    packageimg
  • IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7

    2025年4月25日   

    IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能 数据概述:该数据集包含来自IMDb网站的电影评论数据,已经进行了预处理,适用于情感分析,文本分类等任务。主要特征如下:...
    packageimg
  • 股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman

    2025年4月25日   

    股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman 数据来源:互联网公开数据 标签:股票市场,指数预测,数据集,自然语言处理,BERT模型,金融分析,机器学习,新闻分析 数据概述:...
    packageimg
  • BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban

    2025年4月25日   

    BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
    packageimg
  • BBC新闻训练集BBCNewsTrainingSet-subhashisb

    2025年4月25日   

    BBC新闻训练集BBCNewsTrainingSet-subhashisb 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分类,自然语言处理,机器学习,深度学习,文本分析,学术资源 数据概述:该数据集包含来自BBC新闻的训练数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro

    2025年4月25日   

    电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,标签分类,机器学习,自然语言处理,电影推荐,文本挖掘 数据概述: 该数据集包含来自MovieLens平台的电影剧情数据,记录了电影的剧情描述及其对应的标签。主要特征如下:...
    packageimg
  • 保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410

    2025年4月25日   

    保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410 数据来源:互联网公开数据 标签:保险业,理赔分析,数据集,金融科技,机器学习,数据分析,风险管理,自然语言处理 数据概述: 该数据集包含来自保险行业的理赔数据,记录了理赔申请的详细信息及其分解后的格式化内容。主要特征如下: 时间跨度:...
    packageimg
  • 雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123

    2025年4月25日   

    雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123 数据来源:互联网公开数据 标签:新闻,情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感分类,舆情分析 数据概述: 该数据集包含来自雅虎新闻的文章和对应的情感标签,用于情感分析任务。主要特征如下:...
    packageimg
  • 标注数据集AnnotatedDataDataset-krishaborana

    2025年4月25日   

    标注数据集AnnotatedDataDataset-krishaborana 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,人工智能,数据科学,自然语言处理,图像识别,数据增强 数据概述: 该数据集包含经过人工或自动方式标注的数据,记录了各类数据样本及其对应的标签或注释信息。主要特征如下:...
    packageimg
  • 文章元数据数据集ArticleMeta-dataDataset-gautamsandeep

    2025年4月25日   

    文章元数据数据集ArticleMeta-dataDataset-gautamsandeep 数据来源:互联网公开数据 标签:元数据,数据集,信息检索,文本分析,自然语言处理,学术研究,知识发现,数据挖掘 数据概述:该数据集包含来自学术文章的元数据,记录了文章的各种信息,如标题,摘要,作者,关键词,出版日期,期刊信息等。主要特征如下:...
    packageimg
  • 文本转国际音标训练集TexttoIPAMappingTrainset-jakir57

    2025年4月25日   

    文本转国际音标训练集TexttoIPAMappingTrainset-jakir57 数据来源:互联网公开数据 标签:文本转音标,数据集,语音识别,自然语言处理,机器学习,语言学,音标转换,人工智能 数据概述:...
    packageimg
  • 法官判决命中数据集JudgeHitData-jidbro1

    2025年4月25日   

    法官判决命中数据集JudgeHitData-jidbro1 数据来源:互联网公开数据 标签:司法,判决,数据集,机器学习,法律,文本分析,自然语言处理,刑事案件 数据概述: 该数据集包含法官判决相关数据,旨在用于研究判决结果预测,法律文本分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围从[起始年份]到[结束年份],例如2010年至2020年。...
    packageimg