-
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,文本生成,智能客服 数据概述: 该数据集包含来自大型语言模型基础对话训练的数据,记录了模型与用户之间的对话交互内容。主要特征如下:... -
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,语言模型,数据处理,学术研究 数据概述:该数据集包含来自科勒里奇项目(Coleridge... -
语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy
语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy 数据来源:互联网公开数据 标签:自然语言处理,深度学习,机器学习,数据集,模型训练,神经网络,人工智能,语言模型 数据概述:... -
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:... -
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,数据集,机器学习,文本预处理,语言模型,算法研究 数据概述: 该数据集包含经过预处理的由人工智能生成的文本数据,记录了多种类型和风格的文本内容。主要特征如下:... -
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 提示工程, 自然语言处理, 文本编辑, 语料库, 语言模型, 机器学习 数据概述:... -
Transformer模型翻译数据集iTransformerDataset-tylerfarnan
Transformer模型翻译数据集iTransformerDataset-tylerfarnan 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,Transformer,文本处理,语言模型,深度学习,翻译质量 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 可读性分析, 语言模型, 机器学习, 文本特征, 写作质量 数据概述: 该数据集包含来自不同来源的英语写作文本,记录了用于评估英语写作质量的各项指标。主要特征如下:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,深度学习,自然语言处理,数据集,机器学习,人工智能,文本分析,语言模型 数据概述:该数据集包含来自CLIP(Contrastive Language-Image Pre-... -
阅读理解数据集ReadingComprehensionDatasets-parthplc
阅读理解数据集ReadingComprehensionDatasets-parthplc 数据来源:互联网公开数据 标签:阅读理解, 自然语言处理, 文本分析, 问答系统, 机器阅读, 文本挖掘, 数据集, 语言模型 数据概述: 该数据集包含来自多个公开阅读理解项目的数据,旨在评估和训练模型在理解文本、回答问题以及进行推理方面的能力。主要特征如下:... -
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19 数据来源:互联网公开数据 标签:文本分类, 土耳其语, 语料库, 自然语言处理, 机器学习, 文本嵌入, 语言模型, 类别标注 数据概述: 该数据集包含来自不同来源的土耳其语文本,记录了用于文本分类任务的句子及对应的类别信息。主要特征如下:... -
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku 数据来源:互联网公开数据 标签:机器翻译,反译,数据集,自然语言处理,深度学习,文本编码,语言模型,数据增强 数据概述:... -
思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati
思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,数据处理,文本标记化,人工智能 数据概述: 该数据集包含来自“思考队列”项目的标记化文本数据,记录了文本内容的标记化处理结果。主要特征如下:... -
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001 数据来源:互联网公开数据 标签:自然语言处理,NLP,推理,数据集,机器学习,文本分析,语言模型,人工智能 数据概述:... -
文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock
文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本质量, 语言模型, 多维度评分, 情感分析 数据概述: 该数据集包含用于评估文本可读性的相关数据,主要用于训练和测试文本可读性评估模型。主要特征如下:... -
乌尔都语GPT对话数据集-laibaasmatullah
乌尔都语GPT对话数据集-laibaasmatullah 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,对话,GPT,语言模型,文本生成,数据集,人工智能 数据概述:该数据集包含基于GPT模型的乌尔都语对话数据,记录了用户与模型之间的交互内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,持续更新。... -
长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112
长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,深度学习,文本挖掘,情感计算,语言模型 数据概述: 该数据集包含来自网络公开平台的文本评论数据,记录了用户对不同产品或服务的情感倾向。主要特征如下:... -
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源:互联网公开数据 标签:人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理 数据概述:... -
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本校对,拼写检查,自然语言处理,数据集,机器学习,语言模型,文本纠错,数据清洗 数据概述: 该数据集包含用于文本校对和拼写检查的文本数据,记录了包含拼写错误和对应正确拼写的文本对。主要特征如下:...