-
谷歌网络文档过滤边界框数据集GWD-FilteredBoundingBoxDataset-rifat963
谷歌网络文档过滤边界框数据集GWD-FilteredBoundingBoxDataset-rifat963 数据来源:互联网公开数据 标签:计算机视觉,目标检测,数据集,边界框,图像处理,深度学习,文本检测,文档分析 数据概述: 该数据集包含从谷歌网络文档中提取的过滤边界框数据,用于目标检测和文档分析任务。主要特征如下:... -
文本检测数据集TextDetectionDataset-programmer3
文本检测数据集TextDetectionDataset-programmer3 数据来源:互联网公开数据 标签:文本检测,数据集,图像分析,机器学习,视觉识别,计算机视觉,光学字符识别,人工智能 数据概述:该数据集包含来自多个来源的图像数据,记录了不同场景中的文本实例及其位置信息,适用于文本检测和识别任务。主要特征如下:... -
LLM文本检测数据集-wcylxh
LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。... -
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:... -
吉米尼生成论文数据集-2023-mouadberqia
吉米尼生成论文数据集-2023-mouadberqia 数据来源:互联网公开数据 标签:吉米尼模型,人工智能,生成文本,论文,写作竞赛,数据集,语言模型,文本检测 数据概述: 本数据集包含了由最新吉米尼Pro模型生成的120篇论文。这些论文是根据“LLM - Detect AI Generated... -
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil 数据来源:互联网公开数据 标签:LLM,大模型,文本检测,AI生成,重复文本,数据集,文本处理,训练数据,机器学习 数据概述: 本数据集包含用于“LLM - Detect AI Generated... -
大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛
大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛 数据来源:互联网公开数据 标签:LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据 数据概述: 本数据集是为LLM(大型语言模型)生成文本检测竞赛收集的。数据来源于多个公开的文本资源,涵盖了不同来源和类型的文本,旨在用于训练和评估检测模型,以识别由LLM生成的文本。... -
大语言模型生成文本检测数据集
大语言模型生成文本检测数据集 数据来源:互联网公开数据 标签:大语言模型,文本检测,机器学习,数据合成,竞争数据 数据概述: 本数据集来自Kaggle竞赛“LLM - Detect AI Generated... -
人类与机器生成文本对比研究数据集
人类与机器生成文本对比研究数据集 数据来源:互联网公开数据 标签:机器学习,文本生成,自然语言处理,文本检测,文学作品,编程代码 数据概述: 本数据集包含人类撰写和由大型语言模型(GPT-4 和... -
光学字符识别火车文本检测数据集
光学字符识别火车文本检测数据集 数据来源:互联网公开数据 标签:OCR技术,火车识别,文本检测,图像标注,计算机视觉,交通数据,铁路运输,文字识别,对象检测 数据概述:... -
OCR可机读区MRZ文本检测数据集
OCR可机读区MRZ文本检测数据集 数据来源:互联网公开数据 标签:OCR, 文本检测, 文本识别, 机器可读区, MRZ, 证件识别, 深度学习, 生成数据, 合成数据, 证件安全, 网络安全, 人工智能 数据概述... -
生成式语言模型文章数据集
生成式语言模型文章数据集 数据来源:互联网公开数据 标签:生成式语言模型,文章生成,自然语言处理,文本检测,机器学习,深度学习,LLM 数据概述: 本数据集由GPT4、GPT2、Mistral和Gemma四种生成式语言模型生成,涵盖了一个特定的作文提示,该提示来自Kaggle的llm-detect-ai-generated-... -
大模型生成文本补充数据集
大模型生成文本补充数据集 数据来源:互联网公开数据 标签:大模型,生成文本,竞争数据,文本检测,提示恢复,Kaggle竞赛,AI生成文本识别 数据概述: 本数据集提供了适用于大模型-centric... -
AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试
AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试 数据来源:互联网公开数据 标签:人工智能,文本生成,聊天机器人,自然语言处理,文本检测,机器学习,竞赛数据,ChatGPT,Bard,Bing 数据概述:... -
写作训练数据集
写作训练数据集 数据来源:互联网公开数据 标签:写作训练,学生作文,人工智能生成文本,语言模型,竞赛数据,文本检测 数据概述: 本数据集包含约1398篇作文,其中包括学生撰写的作品和大型语言模型(LLM)生成的文本。该数据集专为“LLM -... -
用于文本检测的尼泊尔手写图像:各个年龄段的详尽文本数据集
尼泊尔手写数据集 (NHD),它是尼泊尔各个地区用相机捕捉的尼泊尔手写文本图像的集合。该数据集旨在为研究人员探索手写检测和识别新技术提供基准。我们还提供了使用成熟的深度学习框架进行文本定位和识别的基准结果。数据集和基准结果可在此处获得。 主要特点:...