LLM提示恢复合成数据集

LLM提示恢复合成数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,合成数据,自然语言处理,人工智能,机器学习,数据竞赛 数据概述: 本数据集使用Gemma 7B-IT生成了1000个示例,用于LLM提示恢复竞赛。数据集基于@thedrcat的原始数据集进行扩展,包含两个额外的列:一是Gemma 7B-IT生成的原始输出,二是去除“Sure… blah blah\n\n”句子后的清理输出。数据集文件为gemma1000_7b.csv,生成时使用了vLLM服务器托管的Gemma 7B-IT模型,并通过HuggingFace CLI进行身份验证以获取模型权重。 数据用途概述: 该数据集适用于LLM提示恢复任务的研究与开发,帮助参赛者和研究者评估和改进提示恢复模型的性能。数据集也适用于自然语言处理和机器学习领域内的教育培训,为学习者提供丰富的实践素材。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.93 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。