找到743个数据集

标签: 语言模型

过滤结果
  • LLM文本检测数据集-wcylxh

    2025年4月24日   

    LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 通义千问问答结果数据集Qwen-QAResultsDataset-bartamin

    2025年4月24日   

    通义千问问答结果数据集Qwen-QAResultsDataset-bartamin 数据来源:互联网公开数据 标签:问答,自然语言处理,数据集,文本生成,模型评估,机器学习,人工智能,语言模型 数据概述: 该数据集包含了通义千问(Qwen)大语言模型的问答结果,记录了模型对不同问题的回答。主要特征如下: 时间跨度:数据记录的时间范围为发布时间。...
    packageimg
  • CommonLit阅读理解测评数据集-jackson786

    2025年4月24日   

    CommonLit阅读理解测评数据集-jackson786 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,教育,数据集,机器学习,文本分类,语言模型 数据概述: 该数据集包含CommonLit公司的阅读理解测评数据,记录了学生在阅读不同文本后的理解能力评估结果。主要特征如下:...
    packageimg
  • 语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8

    2025年4月24日   

    语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8 数据来源:互联网公开数据 标签:语言模型,检测,数据集,训练,测试,自然语言处理,机器学习,安全技术 数据概述:该数据集包含用于语言模型检测的训练和测试数据,记录了不同类型文本的特征和标签,适用于语言模型的检测和评估任务。主要特征如下:...
    packageimg
  • 自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor

    2025年4月24日   

    自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源:互联网公开数据 标签:自然语言处理,文本到文本,数据集,机器学习,深度学习,语言模型,翻译,文本生成 数据概述: 该数据集包含自然语言处理中的文本到文本转换任务数据,记录了输入文本和对应的输出文本。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21

    2025年4月24日   

    阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • Ankit推理数据集AnkitInferenceDataset-andysama79

    2025年4月24日   

    Ankit推理数据集AnkitInferenceDataset-andysama79 数据来源:互联网公开数据 标签:推理,数据集,自然语言处理,机器学习,文本分析,人工智能,深度学习,语言模型 数据概述: 该数据集包含来自Ankit项目的推理数据,记录了用于训练和评估自然语言处理模型的文本数据。主要特征如下:...
    packageimg
  • 论辩训练数据集ArgumentTrainingDataset-wcqyfly

    2025年4月24日   

    论辩训练数据集ArgumentTrainingDataset-wcqyfly 数据来源:互联网公开数据 标签:自然语言处理,文本分类,论辩分析,机器学习,情感分析,文本挖掘,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的论辩文本数据,记录了不同主题的论辩内容和相关特征。主要特征如下:...
    packageimg
  • 科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan

    2025年4月24日   

    科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan 数据来源:互联网公开数据 标签:语言模型,科学考试,数据集,机器学习,自然语言处理,教育,考试评估,知识图谱 数据概述:该数据集包含来自Kaggle的科学考试数据,记录了包含上下文信息的科学考试题及其答案。主要特征如下:...
    packageimg
  • 诗歌韵律预测数据集PoemMeterPredictionDataset-mhami2022

    2025年4月24日   

    诗歌韵律预测数据集PoemMeterPredictionDataset-mhami2022 数据来源:互联网公开数据 标签:诗歌分析,韵律预测,数据集,自然语言处理,机器学习,文本分析,文学研究,语言模型 数据概述: 该数据集包含来自公开诗歌数据库的诗歌作品,记录了诗歌的文本内容和对应的韵律信息。主要特征如下:...
    packageimg
  • 机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876

    2025年4月24日   

    机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876 数据来源:互联网公开数据 标签:机器翻译,文本对齐,数据集,自然语言处理,多语言,深度学习,数据增强,语言模型 数据概述:该数据集包含来自 My Dear Watson...
    packageimg
  • 文本分类数据集TextClassificationDataset-albellna

    2025年4月24日   

    文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:...
    packageimg
  • Mistral提示数据集MistralPromptDataset-isrswsiser

    2025年4月24日   

    Mistral提示数据集MistralPromptDataset-isrswsiser 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,机器学习,语言模型,文本生成,人工智能,深度学习 数据概述: 该数据集包含来自Mistral项目的提示数据,记录了用于训练和优化语言模型的提示样本。主要特征如下:...
    packageimg
  • 元学习语言模型数据集Meta-LLMsDataset-daqueen

    2025年4月24日   

    元学习语言模型数据集Meta-LLMsDataset-daqueen 数据来源:互联网公开数据 标签:语言模型,元学习,数据集,自然语言处理,机器学习,人工智能,深度学习,文本生成 数据概述:该数据集包含了来自多个来源的文本数据,用于训练和评估元学习语言模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。...
    packageimg
  • ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01

    2025年4月24日   

    ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,文本生成,语言模型,数据挖掘 数据概述: 该数据集包含来自ChatGPT中文对话生成任务的数据,记录了中文自然语言对话的样本。主要特征如下:...
    packageimg
  • 越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang

    2025年4月24日   

    越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang 数据来源:互联网公开数据 标签:视频分类,数据集,自然语言处理,机器学习,视频内容分析,语言模型,越南语,文本分类...
    packageimg
  • 数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb

    2025年4月24日   

    数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb 数据来源:互联网公开数据 标签:数据增强,反向翻译,数据集,自然语言处理,机器学习,文本处理,语言模型,翻译技术 数据概述:...
    packageimg
  • 新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari

    2025年4月24日   

    新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari 数据来源:互联网公开数据 标签:新闻,标题生成,数据集,自然语言处理,文本生成,机器学习,语言模型,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的标题,旨在为新闻标题生成任务提供数据支持。主要特征如下:...
    packageimg