找到743个数据集

标签: 语言模型

过滤结果
  • 提示词数据集PromptsDataset1-sandeepnambiar02

    2025年4月26日   

    提示词数据集PromptsDataset1-sandeepnambiar02 数据来源:互联网公开数据 标签:自然语言处理,数据集,提示工程,人工智能,机器学习,文本生成,语言模型,数据挖掘 数据概述: 该数据集专注于收集各类提示词(prompts),记录了不同场景下的文本提示信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti

    2025年4月22日   

    香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti 数据来源:互联网公开数据 标签:香港证监会,注册数据,人口统计信息,性别,种族,年龄,姓名分析,大数据,语言模型 数据概述:...
    packageimg
  • 文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees

    2025年4月26日   

    文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:...
    packageimg
  • 全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz

    2025年4月26日   

    全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,语言模型,文本分析,摘要生成 数据概述:...
    packageimg
  • 笑话内容分类数据集JokesDataset-yaroslav62

    2025年4月26日   

    笑话内容分类数据集JokesDataset-yaroslav62 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,幽默分析,机器学习,情感分析,娱乐内容,语言模型 数据概述: 该数据集包含来自互联网的笑话内容数据,记录了各类笑话的文本信息及其相关分类标签。主要特征如下:...
    packageimg
  • 语法修正数据集GrammarCorrectionDataDataset-uwelcomem

    2025年4月26日   

    语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。...
    packageimg
  • 辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore

    2025年4月26日   

    辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源:互联网公开数据 标签:剧本,文本分析,数据集,自然语言处理,机器学习,电视节目,对话分析,语言模型 数据概述:该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据,记录了节目的对话和剧情内容。主要特征如下:...
    packageimg
  • 大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo

    2025年4月26日   

    大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo 数据来源:互联网公开数据 标签:人工智能,语言模型,数据集,机器学习,自然语言处理,深度学习,算法研究,科技应用 数据概述:...
    packageimg
  • UIT问答数据集UITQADataset-callmelee117

    2025年4月26日   

    UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:...
    packageimg
  • 多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc

    2025年4月26日   

    多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源:互联网公开数据 标签:机器翻译,文本转换,多任务学习,数据集,自然语言处理,深度学习,人工智能,语言模型 数据概述: 该数据集由MT5(Multitask Translation Transformer)项目提供,专注于多任务翻译和文本转换任务。主要特征如下:...
    packageimg
  • 文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban

    2025年4月26日   

    文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源:互联网公开数据 标签:自然语言处理, 文本标注, 数据集, 机器学习, 深度学习, 语义分析, 语言模型, 计算语言学 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的文本标签信息。主要特征如下:...
    packageimg
  • 文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro

    2025年4月26日   

    文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:...
    packageimg
  • 书籍文本错误纠正数据集-shuaibing

    2025年4月26日   

    书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。...
    packageimg
  • 英语与印地语混合语料数据集HinglishDataset-saahir2629

    2025年4月26日   

    英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:...
    packageimg
  • 高棉语文本数据集KhmerTextDataset123-layacheadeth

    2025年4月26日   

    高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • GPT-2模型训练数据集EP2-LR8e5-blackitten13

    2025年4月26日   

    GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...
    packageimg
  • 自然语言处理项目数据集DatasetforNLPProject-namang04

    2025年4月26日   

    自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,深度学习,语言模型,情感分析,文本分类 数据概述: 该数据集为自然语言处理项目设计,记录了多种文本数据,适用于文本分类,情感分析,语言模型训练等任务。主要特征如下:...
    packageimg
  • ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci

    2025年4月26日   

    ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,社交媒体,推文,机器学习,文本分析,情感分析,语言模型,人工智能...
    packageimg
  • 孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani

    2025年4月26日   

    孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:...
    packageimg
  • 自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192

    2025年4月26日   

    自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:...
    packageimg