数据集 - 海数据

大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco

2025年5月29日

大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源：互联网公开数据标签：自然语言处理，对话系统，数据集，机器学习，人工智能，语言模型，文本生成，智能客服数据概述：该数据集包含来自大型语言模型基础对话训练的数据，记录了模型与用户之间的对话交互内容。主要特征如下：...

ZIP

科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck

2025年5月29日

科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源：互联网公开数据标签：文本处理，数据集，自然语言处理，机器学习，文本分析，语言模型，数据处理，学术研究数据概述：该数据集包含来自科勒里奇项目（Coleridge...

ZIP

语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy

2025年5月29日

语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy 数据来源：互联网公开数据标签：自然语言处理，深度学习，机器学习，数据集，模型训练，神经网络，人工智能，语言模型数据概述：...

ZIP

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen

2025年5月29日

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源：互联网公开数据标签：自然语言处理，文本数据，数据集，文本清洗，机器学习，语言模型，信息检索，文本分析数据概述：该数据集是维基文本清洗数据集的第二部分，包含了从维基百科中提取和清洗过的文本数据。主要特征如下：...

ZIP

人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad

2025年5月29日

人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad 数据来源：互联网公开数据标签：人工智能，自然语言处理，文本生成，数据集，机器学习，文本预处理，语言模型，算法研究数据概述：该数据集包含经过预处理的由人工智能生成的文本数据，记录了多种类型和风格的文本内容。主要特征如下：...

ZIP

文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou

2025年5月29日

文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源：互联网公开数据标签：文本生成, 风格迁移, 提示工程, 自然语言处理, 文本编辑, 语料库, 语言模型, 机器学习数据概述：...

ZIP

Transformer模型翻译数据集iTransformerDataset-tylerfarnan

2025年5月29日

Transformer模型翻译数据集iTransformerDataset-tylerfarnan 数据来源：互联网公开数据标签：机器翻译，自然语言处理，数据集，Transformer，文本处理，语言模型，深度学习，翻译质量数据概述：...

ZIP

英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay

2025年5月29日

英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay 数据来源：互联网公开数据标签：文本分析, 写作评估, 自然语言处理, 可读性分析, 语言模型, 机器学习, 文本特征, 写作质量数据概述：该数据集包含来自不同来源的英语写作文本，记录了用于评估英语写作质量的各项指标。主要特征如下：...

ZIP

计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002

2025年5月29日

计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，语言模型，计算重用，语义理解，人工智能数据概述：该数据集包含来自词句银行（Word-Sent...

ZIP

文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan

2025年5月29日

文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源：互联网公开数据标签：文本嵌入，深度学习，自然语言处理，数据集，机器学习，人工智能，文本分析，语言模型数据概述：该数据集包含来自CLIP（Contrastive Language-Image Pre-...

ZIP

阅读理解数据集ReadingComprehensionDatasets-parthplc

2025年5月29日

阅读理解数据集ReadingComprehensionDatasets-parthplc 数据来源：互联网公开数据标签：阅读理解, 自然语言处理, 文本分析, 问答系统, 机器阅读, 文本挖掘, 数据集, 语言模型数据概述：该数据集包含来自多个公开阅读理解项目的数据，旨在评估和训练模型在理解文本、回答问题以及进行推理方面的能力。主要特征如下：...

ZIP

土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19

2025年5月29日

土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19 数据来源：互联网公开数据标签：文本分类, 土耳其语, 语料库, 自然语言处理, 机器学习, 文本嵌入, 语言模型, 类别标注数据概述：该数据集包含来自不同来源的土耳其语文本，记录了用于文本分类任务的句子及对应的类别信息。主要特征如下：...

ZIP

机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku

2025年5月29日

机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku 数据来源：互联网公开数据标签：机器翻译，反译，数据集，自然语言处理，深度学习，文本编码，语言模型，数据增强数据概述：...

ZIP

思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati

2025年5月29日

思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，语言模型，数据处理，文本标记化，人工智能数据概述：该数据集包含来自“思考队列”项目的标记化文本数据，记录了文本内容的标记化处理结果。主要特征如下：...

ZIP

语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001

2025年5月29日

语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001 数据来源：互联网公开数据标签：自然语言处理，NLP，推理，数据集，机器学习，文本分析，语言模型，人工智能数据概述：...

ZIP

文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock

2025年5月29日

文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock 数据来源：互联网公开数据标签：文本分析, 可读性评估, 自然语言处理, 机器学习, 文本质量, 语言模型, 多维度评分, 情感分析数据概述：该数据集包含用于评估文本可读性的相关数据，主要用于训练和测试文本可读性评估模型。主要特征如下：...

ZIP

乌尔都语GPT对话数据集-laibaasmatullah

2025年5月29日

乌尔都语GPT对话数据集-laibaasmatullah 数据来源：互联网公开数据标签：自然语言处理，乌尔都语，对话，GPT，语言模型，文本生成，数据集，人工智能数据概述：该数据集包含基于GPT模型的乌尔都语对话数据，记录了用户与模型之间的交互内容。主要特征如下：时间跨度：数据记录的时间范围不固定，持续更新。...

ZIP

长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112

2025年5月29日

长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，机器学习，深度学习，文本挖掘，情感计算，语言模型数据概述：该数据集包含来自网络公开平台的文本评论数据，记录了用户对不同产品或服务的情感倾向。主要特征如下：...

ZIP

人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii

2025年5月29日

人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源：互联网公开数据标签：人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理数据概述：...

ZIP

文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal

2025年5月29日

文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal 数据来源：互联网公开数据标签：文本校对，拼写检查，自然语言处理，数据集，机器学习，语言模型，文本纠错，数据清洗数据概述：该数据集包含用于文本校对和拼写检查的文本数据，记录了包含拼写错误和对应正确拼写的文本对。主要特征如下：...

ZIP

找到743个数据集

注册成功！