数据集

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛数据来源：互联网公开数据标签：LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据数据概述：本数据集是为LLM（大型语言模型）生成文本检测竞赛收集的。数据来源于多个公开的文本资源，涵盖了不同来源和类型的文本，旨在用于训练和评估检测模型，以识别由LLM生成的文本。

数据来源包括： * PERSUADE 2.0（一个用于评估书面论证的大型语料库） * LLM-Mistral-7B-Instruct文本数据集 * Argugpt数据集 * DAIGT v4 训练数据集 * FPE（Finetuned Prompt Engineering）处理数据集

数据用途概述：该数据集主要用于训练和评估LLM生成文本检测模型。研究人员、开发者和数据科学家可以使用此数据来构建、优化和测试检测算法，以区分人类写作和机器生成的文本。数据集也适用于学术研究、教育培训以及相关竞赛，促进对LLM生成文本的理解和相关技术的进步。

数据与资源

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛.zipZIP
58.83 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	58.83 MiB
最后更新	2025年4月20日
创建于	2025年4月20日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

数据与资源

附加信息

注册成功！