数据集

多语言视频字幕数据集

数据集概述

本数据集包含从二十四段视频中提取的多语言字幕图像，覆盖泰语和英语两种语言，包含泰文字符、罗马字符、泰语数字、阿拉伯数字及特殊字符，总计一百五十七种字符。数据集经预处理后生成带标注的字幕图像，为多语言文字识别研究提供基础数据。

文件详解

该数据集包含四千二百二十五张JPG格式的字幕图像文件，具体说明如下： - 核心文件类型: - JPG图像文件: 共四千二百二十五张，每张图像尺寸为一千二百八十乘七百二十像素，存储视频中的字幕画面。 - 文件命名规则: 文件名以数字开头（表示字幕图像顺序），后接字幕文本内容，例如“2013_เอาส้อมสับได้เลยอะ เห็นปะ.jpg”“3439_I START WRITING STORIES.jpg”。 - 标注信息: 所有图像均通过labelImg程序生成标注，标注内容与字幕文本对应。

适用场景

多语言文字识别研究: 用于泰语与英语混合场景下的光学字符识别（OCR）模型训练与测试。
视频字幕提取技术开发: 支持视频自动字幕提取算法的研发与优化。
字符集识别研究: 可用于泰语特殊字符、数字及符号的识别模型构建。
多语言数据增强: 为多语言自然语言处理任务提供图像形式的文本数据支持。

数据与资源

gj8d88h2g3-2.zipZIP
37.56 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	37.56 MiB
最后更新	2025年11月27日
创建于	2025年11月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。