数据集 - 海数据

语言模型系统数据集LMSYSDatasets-lizhecheng

2025年5月28日

语言模型系统数据集LMSYSDatasets-lizhecheng 数据来源：互联网公开数据标签：自然语言处理，机器学习，数据集，语言模型，文本生成，深度学习，人工智能，模型评估数据概述：该数据集由LMSYS项目提供，主要记录了多种语言模型在文本生成和自然语言处理任务中的表现数据。主要特征如下：...

ZIP

Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg

2025年5月14日

Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，问答系统，信息检索，数据挖掘，语言模型数据概述：该数据集来自Quora平台，记录了用户提交的各类问题及其分类标签。主要特征如下：...

ZIP

越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu

2025年5月1日

越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu 数据来源：互联网公开数据标签：文本增强, 越南语, 自然语言处理, 数据集构建, 机器翻译, 语言模型, 数据扩充, 文本生成数据概述：该数据集包含用于越南语文本数据增强的语料，记录了越南语文本对及其对应的增强版本。主要特征如下：...

ZIP

自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu

2025年5月1日

自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu 数据来源：互联网公开数据标签：自然语言处理, 词汇表, 文本生成, 语言模型, 深度学习, 文本分析, 数据预处理, 词嵌入数据概述：...

ZIP

文本预测模型测试数据集TextPredictionModelTestDataset-lucaskg

2025年4月30日

文本预测模型测试数据集TextPredictionModelTestDataset-lucaskg 数据来源：互联网公开数据标签：文本预测, 模型测试, 自然语言处理, 数据分析, 机器学习, 预测结果, 数据集评估, 语言模型数据概述：该数据集包含来自预测模型的测试结果数据，记录了模型对文本片段的预测输出。主要特征如下：...

ZIP

语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235

2025年4月29日

语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235 数据来源：互联网公开数据标签：语音识别, 中文转写, 语音数据, 文本数据, 声学模型, 语言模型, 深度学习, 数据集数据概述：...

ZIP

文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha

2025年4月29日

文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha 数据来源：互联网公开数据标签：文本改写, 语义相似度, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 语言模型, 文本生成数据概述：...

ZIP

新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen

2025年4月26日

新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen 数据来源：互联网公开数据标签：新闻数据，微调数据集，量化模型，自然语言处理，机器学习，文本分析，AI助手，语言模型数据概述：...

ZIP

对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang

2025年4月26日

对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang 数据来源：互联网公开数据标签：自然语言处理，对话系统，数据集，文本摘要，机器学习，深度学习，语言模型，人工智能数据概述：...

ZIP

高棉语文本数据集KhmerTextDataset123-layacheadeth

2025年4月26日

高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源：互联网公开数据标签：自然语言处理，文本分析，高棉语，机器学习，语言模型，数据集，多语言处理，文本分类数据概述：该数据集包含来自互联网的高棉语文本数据，记录了高棉语的文本内容。主要特征如下：时间跨度：数据记录的时间范围未明确说明。...

ZIP

多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist

2025年4月25日

多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源：互联网公开数据标签：语音识别，机器翻译，多语言，数据集，自然语言处理，人工智能，语音技术，语言模型数据概述：该数据集来自FLEURS（Facebook LibriSpeech Utterance...

ZIP

学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech

2025年4月25日

学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech 数据来源：互联网公开数据标签：学生作文，语言模型，数据集，自然语言处理，文本分析，机器学习，学术研究，教育评估数据概述：该数据集包含来自不同学生的作文以及由语言模型生成的作文样本，适用于作文检测和评估。主要特征如下：...

ZIP

机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876

2025年4月24日

机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876 数据来源：互联网公开数据标签：机器翻译，文本对齐，数据集，自然语言处理，多语言，深度学习，数据增强，语言模型数据概述：该数据集包含来自 My Dear Watson...

ZIP

大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad

2025年4月24日

大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源：互联网公开数据标签：人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本数据概述：...

ZIP

大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001

2025年4月23日

大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001 数据来源：互联网公开数据标签：MMLU,多学科,选择题,语言模型,评估,LLM_Science,竞赛,人工智能,NLP 数据概述：本数据集源自MMLU（Massive Multitask Language...

ZIP

自然语言处理入门数据集NLPStartedDataset-liangyou

2025年4月23日

自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源：互联网公开数据标签：自然语言处理，NLP，文本分析，机器学习，数据集，文本分类，情感分析，语言模型，入门数据概述：该数据集包含多个文本数据集，旨在帮助初学者入门自然语言处理领域。主要特征如下：...

ZIP

语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi

2025年5月31日

语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源：互联网公开数据标签：自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型数据概述：...

ZIP

语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima

2025年5月31日

语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源：互联网公开数据标签：语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集数据概述：...

ZIP

科学考试输入数据数据集-kashiwaba

2025年5月30日

科学考试输入数据数据集-kashiwaba 数据来源：互联网公开数据标签：科学考试，数据集，自然语言处理，文本分析，机器学习，教育，语言模型，考试评估数据概述：该数据集包含用于科学考试的输入数据，主要记录了各种科学考试题目、学生答案以及相关评估信息。主要特征如下：时间跨度：数据记录的时间范围涵盖了不同年份的科学考试题目。...

ZIP

科学考试因果关系语言模型奖励建模数据集-kashiwaba

2025年5月29日

科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源：互联网公开数据标签：语言模型，因果关系，考试，奖励建模，自然语言处理，数据集，人工智能，教育数据概述：该数据集是用于训练和评估科学考试中因果关系理解的语言模型，并进行奖励建模的数据集。主要特征如下：时间跨度：数据涵盖了不同年份和版本的科学考试题目。...

ZIP

找到745个数据集

注册成功！