多语言视频字幕数据集

数据集概述

本数据集包含从二十四段视频中提取的多语言字幕图像,覆盖泰语和英语两种语言,包含泰文字符、罗马字符、泰语数字、阿拉伯数字及特殊字符,总计一百五十七种字符。数据集经预处理后生成带标注的字幕图像,为多语言文字识别研究提供基础数据。

文件详解

该数据集包含四千二百二十五张JPG格式的字幕图像文件,具体说明如下: - 核心文件类型: - JPG图像文件: 共四千二百二十五张,每张图像尺寸为一千二百八十乘七百二十像素,存储视频中的字幕画面。 - 文件命名规则: 文件名以数字开头(表示字幕图像顺序),后接字幕文本内容,例如“2013_เอาส้อมสับได้เลยอะ เห็นปะ.jpg”“3439_I START WRITING STORIES.jpg”。 - 标注信息: 所有图像均通过labelImg程序生成标注,标注内容与字幕文本对应。

适用场景

  • 多语言文字识别研究: 用于泰语与英语混合场景下的光学字符识别(OCR)模型训练与测试。
  • 视频字幕提取技术开发: 支持视频自动字幕提取算法的研发与优化。
  • 字符集识别研究: 可用于泰语特殊字符、数字及符号的识别模型构建。
  • 多语言数据增强: 为多语言自然语言处理任务提供图像形式的文本数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 37.56 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。