大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛 数据来源:互联网公开数据 标签:LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据 数据概述: 本数据集是为LLM(大型语言模型)生成文本检测竞赛收集的。数据来源于多个公开的文本资源,涵盖了不同来源和类型的文本,旨在用于训练和评估检测模型,以识别由LLM生成的文本。

数据来源包括: * PERSUADE 2.0(一个用于评估书面论证的大型语料库) * LLM-Mistral-7B-Instruct文本数据集 * Argugpt数据集 * DAIGT v4 训练数据集 * FPE(Finetuned Prompt Engineering)处理数据集

数据用途概述: 该数据集主要用于训练和评估LLM生成文本检测模型。研究人员、开发者和数据科学家可以使用此数据来构建、优化和测试检测算法,以区分人类写作和机器生成的文本。数据集也适用于学术研究、教育培训以及相关竞赛,促进对LLM生成文本的理解和相关技术的进步。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 58.83 MiB
最后更新 2025年4月20日
创建于 2025年4月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。