数据集 - 海数据

GPT-2模型训练数据集EP2-LR8e5-blackitten13

2025年4月26日

GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，GPT-2，机器学习，模型训练，语言模型，文本分析数据概述：该数据集用于训练 GPT-2 模型，由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...
- ZIP
食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206

2025年4月26日

食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206 数据来源：互联网公开数据标签：食谱，烹饪，数据集，菜谱，食材，自然语言处理，机器学习，文本生成数据概述：该数据集包含来自互联网的食谱数据，记录了各种菜肴的详细信息，旨在用于食谱生成和烹饪相关的研究。主要特征如下：...
- ZIP
幻觉与原始语言概率数据集HallucinationswithRawLanguageProbsDataset-romhim

2025年4月26日

幻觉与原始语言概率数据集HallucinationswithRawLanguageProbsDataset-romhim 数据来源：互联网公开数据标签：自然语言处理，机器学习，数据集，概率模型，语言理解，文本生成，人工智能，深度学习数据概述：...
- ZIP
提示注入变异数据集

2025年4月26日

提示注入变异数据集数据来源：互联网公开数据标签：提示注入,变异数据,安全分析,自然语言处理,机器学习,文本生成,对抗攻击,数据增强,模型鲁棒性数据概述：...
- ZIP
Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari

2025年4月26日

Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari 数据来源：互联网公开数据标签：自然语言处理，机器学习，文本生成，数据集，Qlora，T5模型，OpenOrca，语言模型数据概述：该数据集用于训练Qlora-T5模型，整合了OpenOrca数据集。主要特征如下：时间跨度：...
- ZIP
大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

2025年4月25日

大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源：互联网公开数据标签：语言模型，机器学习，自然语言处理，深度学习，人工智能，文本生成，文本分析，大数据数据概述：该数据集包含用于训练大型语言模型（LLM）的文本数据，特别适用于JAX框架下的LLaMA 13B模型。主要特征如下：...
- ZIP
文档摘要对数据集Document-AbstractPairsDataset-sark07

2025年4月25日

文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，深度学习，文本生成，机器翻译，信息检索，NLP 数据概述：该数据集包含文档及其对应的摘要，旨在用于文本摘要生成任务。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于原始文档的发布时间。...
- ZIP
创意写作文本清洗数据集-mohamednafea01

2025年4月25日

创意写作文本清洗数据集-mohamednafea01 数据来源：互联网公开数据标签：文本数据，创意写作，数据清洗，自然语言处理，文本分析，语料库，机器学习，NLP 数据概述：该数据集包含经过清洗的创意写作文本，旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了不同时期和类型的创意写作文本。...
- ZIP
语言生成器合成文本数据集

2025年4月25日

语言生成器合成文本数据集数据来源：互联网公开数据标签：自然语言处理,文本生成,语言模型训练,合成数据,数据增强,对话模拟,错误注入数据概述：本数据集是由Python工具Linguistic...
- ZIP
DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集

2025年4月25日

DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集数据来源：互联网公开数据标签：自然语言处理,文本生成,机器学习,LLM,训练数据,论文写作,评估,模型训练数据概述：本数据集是DAIGT（Detect AI Generated...
- ZIP
palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak

2025年4月25日

palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak 数据来源：互联网公开数据标签：作文生成，自然语言处理，数据集，机器学习，文本生成，语言模型，教育技术，评估研究数据概述：该数据集包含来自Palm作文生成项目（Palm Essay Generation...
- ZIP
食谱生成数据集RecipeGenerationDataset-devisricharan5

2025年4月25日

食谱生成数据集RecipeGenerationDataset-devisricharan5 数据来源：互联网公开数据标签：食谱，菜谱，食谱生成，自然语言处理，文本生成，烹饪，数据集，机器学习数据概述：该数据集包含来自各种来源的食谱数据，记录了各种菜肴的详细信息。主要特征如下：时间跨度：...
- ZIP
Mistral-7B生成文本数据集-thienanlnguyen

2025年4月25日

Mistral-7B生成文本数据集-thienanlnguyen 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，机器学习，语言模型，生成式AI，文本分析，人工智能数据概述：该数据集包含由 Mistral-7B 语言模型生成的文本数据，用于研究和评估模型的文本生成能力。主要特征如下：时间跨度：数据生成时间为近期。...
- ZIP
大型语言模型数据集LlamaDataset-simakov

2025年4月25日

大型语言模型数据集LlamaDataset-simakov 数据来源：互联网公开数据标签：自然语言处理，机器学习，数据集，文本数据，语言模型，预训练，人工智能，文本生成数据概述：该数据集包含 Llama 项目收集的用于训练大型语言模型的数据，旨在支持文本生成，对话理解等多种自然语言处理任务。主要特征如下：...
- ZIP
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand

2025年4月25日

GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，机器学习，人工智能，语言模型，文本分析，深度学习数据概述：该数据集包含由GPT（生成预训练转换器）模型生成的文本数据，记录了模型在不同输入下的输出文本。主要特征如下：...
- ZIP
句子生成脚本数据集SentenceScriptDataset-indunil19

2025年4月25日

句子生成脚本数据集SentenceScriptDataset-indunil19 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，深度学习，语言模型，文本分析，人工智能，写作辅助数据概述：该数据集包含用于句子生成的脚本数据，记录了各种主题和风格的句子及相关信息。主要特征如下：时间跨度：数据记录的时间范围不定，取决于脚本的创作时间。...
- ZIP
TensorFlow句子自动补全数据集-subho117

2025年4月25日

TensorFlow句子自动补全数据集-subho117 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，深度学习，TensorFlow，自动补全，语言模型，文本分析数据概述：该数据集包含用于训练TensorFlow句子自动补全模型的文本数据，旨在实现对用户输入的句子进行智能补全。主要特征如下：时间跨度：...
- ZIP
JupyterNotebook提示词数据集JB-PromptsV2-balrajprajesh

2025年4月25日

JupyterNotebook提示词数据集JB-PromptsV2-balrajprajesh 数据来源：互联网公开数据标签：自然语言处理，提示词工程，数据集，机器学习，文本生成，人工智能，Jupyter Notebook，prompt 数据概述：该数据集包含了用于 Jupyter Notebook...
- ZIP
Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen

2025年4月25日

Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，机器学习，Llama，Transformer，语言模型，预训练数据概述：该数据集包含用于 Llama 1 模型第一步训练的数据，主要用于构建基础的语言模型。主要特征如下：...
- ZIP
大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham

2025年4月25日

大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham 数据来源：互联网公开数据标签：语言模型，生成器，数据集，自然语言处理，机器学习，文本生成，人工智能，深度学习数据概述：该数据集包含来自多个来源的文本数据，用于训练大型语言模型生成器，记录了各种类型的文本内容。主要特征如下：时间跨度：数据记录的时间范围从2010年到2022年。...
- ZIP

«
1
...
27
28
29
30
31
...
38
»

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？