找到743个数据集

标签: 语言模型

过滤结果
  • 三星自然语言处理数据集SamsungNLPDataset-garvitgarg

    2025年4月25日   

    三星自然语言处理数据集SamsungNLPDataset-garvitgarg 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,情感分析,机器翻译 数据概述: 该数据集由三星公司提供,专注于自然语言处理领域的文本数据,记录了多种自然语言处理任务的训练和测试数据。主要特征如下:...
    packageimg
  • 西班牙语微调标注数据集SpanishLabeledforFine-tuningDataset-suramyajadhav

    2025年4月25日   

    西班牙语微调标注数据集SpanishLabeledforFine-tuningDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,语言模型,文本分类,微调,西班牙语,标注数据 数据概述: 该数据集包含经过标注的西班牙语文本数据,专为语言模型的微调和训练设计。主要特征如下:...
    packageimg
  • 英语学习文本数据集en-train-csv-elguapo

    2025年4月25日   

    英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:...
    packageimg
  • palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak

    2025年4月25日   

    palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak 数据来源: 互联网公开数据 标签:作文生成,自然语言处理,数据集,机器学习,文本生成,语言模型,教育技术,评估研究 数据概述: 该数据集包含来自Palm作文生成项目(Palm Essay Generation...
    packageimg
  • 马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav

    2025年4月25日   

    马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...
    packageimg
  • 预处理语言数据集PreprocessingLanguageData-biatrixwang

    2025年4月25日   

    预处理语言数据集PreprocessingLanguageData-biatrixwang 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,数据集,语言模型,文本分析,数据清洗,机器学习,中文处理 数据概述: 该数据集包含经过预处理的语言数据,旨在为自然语言处理任务提供干净,规范的文本输入。主要特征如下:...
    packageimg
  • 孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif

    2025年4月25日   

    孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,机器翻译,数据集,深度学习,语言模型,机器学习,人工智能 数据概述: 该数据集专注于孟加拉语文本的摘要生成任务,记录了大量的孟加拉语文本及其对应的摘要。主要特征如下:...
    packageimg
  • 并行detoxification并行解毒数据集ParallelDetoxificationDataset-summerbreeze11

    2025年4月25日   

    并行detoxification并行解毒数据集ParallelDetoxificationDataset-summerbreeze11 数据来源:互联网公开数据 标签:自然语言处理,数据集,并行计算,解毒技术,文本过滤,机器学习,语言模型,安全分析 数据概述: 该数据集专注于并行解毒技术,包含大量文本数据及相应的解毒处理结果。主要特征如下:...
    packageimg
  • 摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg

    2025年4月25日   

    摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,数据集,机器学习,文本处理,数据格式化,人工智能,语言模型 数据概述:...
    packageimg
  • 自然语言推理与问答任务数据集ARCDataset-evanhislupus

    2025年4月25日   

    自然语言推理与问答任务数据集ARCDataset-evanhislupus 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,问答系统,语言模型,知识图谱,人工智能,教育评估 数据概述: 该数据集由ARC项目提供,专注于自然语言推理与问答任务的数据支持。主要特征如下: 时间跨度:数据记录的时间范围为2015年至2020年。...
    packageimg
  • Mistral-7B生成文本数据集-thienanlnguyen

    2025年4月25日   

    Mistral-7B生成文本数据集-thienanlnguyen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,语言模型,生成式AI,文本分析,人工智能 数据概述: 该数据集包含由 Mistral-7B 语言模型生成的文本数据,用于研究和评估模型的文本生成能力。主要特征如下: 时间跨度:数据生成时间为近期。...
    packageimg
  • 伊朗波斯语文本数据集PersianDatasetIR-amirali10281

    2025年4月25日   

    伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • GPT生成文本数据集GPT-GeneratedTextDataset-manshanand

    2025年4月25日   

    GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:...
    packageimg
  • 土耳其语文本数据集Linux-denizhanahin

    2025年4月25日   

    土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:...
    packageimg
  • 截断512令牌数据集Truncation512TokensDataset-satoshissss

    2025年4月25日   

    截断512令牌数据集Truncation512TokensDataset-satoshissss 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本截断,机器学习,深度学习,文本分析,语言模型,文本挖掘 数据概述:...
    packageimg
  • 自然语言处理意图识别数据集NLUIntentDetectionDataset-namdcnguyen

    2025年4月25日   

    自然语言处理意图识别数据集NLUIntentDetectionDataset-namdcnguyen 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,文本分类,人工智能,语言模型,语音识别 数据概述: 该数据集专注于自然语言处理中的意图识别任务,记录了用户输入的文本或语音数据及其对应的意图类别。主要特征如下:...
    packageimg
  • 句子生成脚本数据集SentenceScriptDataset-indunil19

    2025年4月25日   

    句子生成脚本数据集SentenceScriptDataset-indunil19 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,语言模型,文本分析,人工智能,写作辅助 数据概述: 该数据集包含用于句子生成的脚本数据,记录了各种主题和风格的句子及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于脚本的创作时间。...
    packageimg
  • TensorFlow句子自动补全数据集-subho117

    2025年4月25日   

    TensorFlow句子自动补全数据集-subho117 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,TensorFlow,自动补全,语言模型,文本分析 数据概述: 该数据集包含用于训练TensorFlow句子自动补全模型的文本数据,旨在实现对用户输入的句子进行智能补全。主要特征如下: 时间跨度:...
    packageimg
  • 消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi

    2025年4月25日   

    消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,信息提取,情感分析,语言模型,数据挖掘 数据概述: 该数据集包含来自互联网的各类消息文本数据,记录了不同类型消息的内容和分类标签。主要特征如下:...
    packageimg