-
语言模型系统数据集LMSYSDatasets-lizhecheng
语言模型系统数据集LMSYSDatasets-lizhecheng 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,语言模型,文本生成,深度学习,人工智能,模型评估 数据概述: 该数据集由LMSYS项目提供,主要记录了多种语言模型在文本生成和自然语言处理任务中的表现数据。主要特征如下:... -
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,语言模型 数据概述: 该数据集来自Quora平台,记录了用户提交的各类问题及其分类标签。主要特征如下:... -
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu 数据来源:互联网公开数据 标签:文本增强, 越南语, 自然语言处理, 数据集构建, 机器翻译, 语言模型, 数据扩充, 文本生成 数据概述: 该数据集包含用于越南语文本数据增强的语料,记录了越南语文本对及其对应的增强版本。主要特征如下:... -
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu 数据来源:互联网公开数据 标签:自然语言处理, 词汇表, 文本生成, 语言模型, 深度学习, 文本分析, 数据预处理, 词嵌入 数据概述:... -
文本预测模型测试数据集TextPredictionModelTestDataset-lucaskg
文本预测模型测试数据集TextPredictionModelTestDataset-lucaskg 数据来源:互联网公开数据 标签:文本预测, 模型测试, 自然语言处理, 数据分析, 机器学习, 预测结果, 数据集评估, 语言模型 数据概述: 该数据集包含来自预测模型的测试结果数据,记录了模型对文本片段的预测输出。主要特征如下:... -
语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235
语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235 数据来源:互联网公开数据 标签:语音识别, 中文转写, 语音数据, 文本数据, 声学模型, 语言模型, 深度学习, 数据集 数据概述:... -
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha 数据来源:互联网公开数据 标签:文本改写, 语义相似度, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 语言模型, 文本生成 数据概述:... -
新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen
新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen 数据来源:互联网公开数据 标签:新闻数据,微调数据集,量化模型,自然语言处理,机器学习,文本分析,AI助手,语言模型 数据概述:... -
对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang
对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,文本摘要,机器学习,深度学习,语言模型,人工智能 数据概述:... -
高棉语文本数据集KhmerTextDataset123-layacheadeth
高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。... -
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance... -
学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech
学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech 数据来源:互联网公开数据 标签:学生作文,语言模型,数据集,自然语言处理,文本分析,机器学习,学术研究,教育评估 数据概述:该数据集包含来自不同学生的作文以及由语言模型生成的作文样本,适用于作文检测和评估。主要特征如下:... -
机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876
机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876 数据来源:互联网公开数据 标签:机器翻译,文本对齐,数据集,自然语言处理,多语言,深度学习,数据增强,语言模型 数据概述:该数据集包含来自 My Dear Watson... -
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:... -
大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001
大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001 数据来源:互联网公开数据 标签:MMLU,多学科,选择题,语言模型,评估,LLM_Science,竞赛,人工智能,NLP 数据概述: 本数据集源自MMLU(Massive Multitask Language... -
自然语言处理入门数据集NLPStartedDataset-liangyou
自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,机器学习,数据集,文本分类,情感分析,语言模型,入门 数据概述: 该数据集包含多个文本数据集,旨在帮助初学者入门自然语言处理领域。主要特征如下:... -
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源:互联网公开数据 标签:自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型 数据概述:... -
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源:互联网公开数据 标签:语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集 数据概述:... -
科学考试输入数据数据集-kashiwaba
科学考试输入数据数据集-kashiwaba 数据来源:互联网公开数据 标签:科学考试,数据集,自然语言处理,文本分析,机器学习,教育,语言模型,考试评估 数据概述:该数据集包含用于科学考试的输入数据,主要记录了各种科学考试题目、学生答案以及相关评估信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年份的科学考试题目。... -
科学考试因果关系语言模型奖励建模数据集-kashiwaba
科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源:互联网公开数据 标签:语言模型,因果关系,考试,奖励建模,自然语言处理,数据集,人工智能,教育 数据概述: 该数据集是用于训练和评估科学考试中因果关系理解的语言模型,并进行奖励建模的数据集。主要特征如下: 时间跨度:数据涵盖了不同年份和版本的科学考试题目。...