-
InstructIE_Based_双语指令信息抽取数据集
2026年1月30日 30 120 101
数据集概述 本数据集为InstructIE双语指令信息抽取数据集,包含中文和英文两种语言的指令调优数据,覆盖事件、自然科学、建筑结构等多个类别。数据集由9个文件组成,主要文件格式为JSON和MD,适用于信息抽取任务的模型训练与评估。 文件详解 说明文档 文件名称:README_ZH.md、README.md 文件格式:MD...
-
Secure_Instruct安全代码生成指令调优数据集合成管道
2025年12月19日 30 54 5
数据集概述 该数据集是用于安全代码生成的指令调优数据集合成管道,基于CWE文档数据,通过自动化流程帮助大语言模型学习生成安全代码,包含说明文档和复现包。 文件详解 文件名称: README_secure_instruct.md 文件格式: Markdown (.md) 内容说明: 提供Secure-...
-
开放数学指令调优数据集-2023
2025年5月31日 30 38 30
开放数学指令调优数据集-2023 数据来源:互联网公开数据 标签:数学,指令调优,教育,数据集,问题解答,代码解析,机器学习,模型训练 数据概述: 开放数学指令调优数据集(OpenMathInstruct-1)包含180万个问题-...
-
Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02
2025年4月29日 30 100 88
Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02 数据来源:互联网公开数据 标签:Prompt工程, 人工智能, 自然语言处理, 文本生成, 指令调优, 大语言模型, 数据标注, 评估指标 数据概述:...



