找到11,768个数据集

标签: 自然语言处理

过滤结果
  • 科学考试因果关系语言模型奖励建模数据集-kashiwaba

    2025年5月29日   

    科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源:互联网公开数据 标签:语言模型,因果关系,考试,奖励建模,自然语言处理,数据集,人工智能,教育 数据概述: 该数据集是用于训练和评估科学考试中因果关系理解的语言模型,并进行奖励建模的数据集。主要特征如下: 时间跨度:数据涵盖了不同年份和版本的科学考试题目。...
    packageimg
  • Gemma2模型微调数据集-anshdarji

    2025年5月29日   

    Gemma2模型微调数据集-anshdarji 数据来源:互联网公开数据 标签:大语言模型,微调,数据集,自然语言处理,文本生成,机器学习,人工智能,Gemma 数据概述:该数据集包含了用于微调 Gemma 2 模型的数据,旨在提升模型在特定任务上的表现。主要特征如下: 时间跨度:数据生成时间随数据集内容而异,涵盖不同时间段的文本信息。...
    packageimg
  • 微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019

    2025年5月29日   

    微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019 数据来源:互联网公开数据 标签:机器阅读理解,自然语言处理,信息检索,数据集,排序学习,深度学习,问答系统,文本匹配 数据概述: 该数据集包含来自微软大规模机器阅读理解(MS MARCO)数据集的多元排序(MNR)数据,专门用于信息检索和问答系统的研究。主要特征如下:...
    packageimg
  • 英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg

    2025年5月29日   

    英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,数据集,语言模型,文本生成,语义分析,人工智能 数据概述:...
    packageimg
  • 文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh

    2025年5月29日   

    文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:...
    packageimg
  • 推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08

    2025年5月29日   

    推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08 数据来源:互联网公开数据 标签:社交媒体,情绪分析,自然语言处理,文本挖掘,机器学习,情感分类,数据分析,推特 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,记录了推文文本及其对应的情绪标签。主要特征如下: 时间跨度:...
    packageimg
  • 数据2020年Shopee代码联赛情感分析数据集-rareloto

    2025年5月29日   

    2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。...
    packageimg
  • 推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali

    2025年5月29日   

    推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,用户行为,文本分析,情感分析,机器学习,自然语言处理 数据概述: 该数据集包含来自推特平台的公开数据,记录了用户行为和推文内容。主要特征如下:...
    packageimg
  • 中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari

    2025年5月29日   

    中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:...
    packageimg
  • 大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis

    2025年5月29日   

    大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,预训练,数据集,文本数据,深度学习,语言模型,人工智能 数据概述: 该数据集包含了用于大规模语言模型(LLM)预训练的文本数据,旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下: 时间跨度:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92

    2025年5月29日   

    IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,文本挖掘,机器学习,情感分类,NLP 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik

    2025年5月29日   

    新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 语料库, 新闻文章, 语义分析 数据概述: 该数据集包含来自 GigaWord...
    packageimg
  • 生物医学文献摘要分析数据集BiomedicalLiteratureAbstractAnalysisDataset-fabulinus

    2025年5月29日   

    生物医学文献摘要分析数据集BiomedicalLiteratureAbstractAnalysisDataset-fabulinus 数据来源:互联网公开数据 标签:生物医学, 文献分析, 文本摘要, 疫情研究, 文本挖掘, 自然语言处理, 科学研究, 语料库 数据概述:...
    packageimg
  • BotezLive直播聊天记录分类数据集-brandonbenton

    2025年5月29日   

    BotezLive直播聊天记录分类数据集-brandonbenton 数据来源:互联网公开数据 标签:直播聊天,文本分类,数据集,机器学习,自然语言处理,游戏直播,社区互动,情感分析 数据概述: 该数据集包含了 BotezLive 直播平台的聊天记录,旨在用于文本分类和情感分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了...
    packageimg
  • 电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate

    2025年5月29日   

    电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, 深度学习, 文本分类, 数据集, 机器学习, PyTorch模型 数据概述:...
    packageimg
  • 学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990

    2025年5月29日   

    学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...
    packageimg
  • 自然语言处理模型训练与测试代码及配置数据集NaturalLanguageProcessingModelTrainingandTestingCodeandC...

    2025年5月29日   

    自然语言处理模型训练与测试代码及配置数据集NaturalLanguageProcessingModelTrainingandTestingCodeandConfigurationDataset-a24998667 数据来源:互联网公开数据 标签:自然语言处理, 深度学习, 模型训练, 文本处理, 机器学习, 代码, 配置, 测试 数据概述:...
    packageimg
  • 自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater

    2025年5月29日   

    自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,机器翻译,项目复现 数据概述: 该数据集旨在为自然语言处理(NLP)项目复现提供数据支持,包含多种文本类型和任务的数据集。主要特征如下: 时间跨度:...
    packageimg
  • 产品用户评论情感分析数据集ProductUserReviewSentimentAnalysis-deepkumarprasad

    2025年5月29日   

    产品用户评论情感分析数据集ProductUserReviewSentimentAnalysis-deepkumarprasad 数据来源:互联网公开数据 标签:情感分析, 用户评论, 文本挖掘, 情感分类, 机器学习, 自然语言处理, 评价指标, 数据标注 数据概述:...
    packageimg
  • 增强数据集3AugmentedDataset3-gnart2004

    2025年5月29日   

    增强数据集3AugmentedDataset3-gnart2004 数据来源:互联网公开数据 标签:数据增强,数据集,机器学习,数据科学,深度学习,计算机视觉,自然语言处理,人工智能 数据概述: 该数据集为增强数据集3,主要包含经过增强处理的数据,适用于机器学习、深度学习等任务。主要特征如下: 时间跨度:数据记录的时间范围未明确提供。...
    packageimg