-
IN02046_Based加德满都Jaisideval铭文梵语XML草稿版数据
2026年1月20日 30 31 18
数据集概述 本数据集为IN02046加德满都Jaisideval铭文的梵语XML文件,采用EPIDOC格式的草稿版本,计划纳入“Siddham”档案。文件未包含元数据,是一份单一的古铭文数字化文本资源。 文件详解 文件名称:IN02046.xml 文件格式:XML...
-
Oxford_Merton_MS_249_Bestiaire抄写缩写研究数据集
2026年1月19日 30 120 114
数据集概述 本数据集为牛津默顿学院图书馆MS 249号手稿(《Bestiaire》)1r至10v页的抄写缩写研究配套数据,包含3个文件,涵盖缩写判定标准、文本转写编码及缩写统计分析,用于中世纪手稿抄写缩写模式的学术研究。 文件详解...
-
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe
2025年4月30日 30 190 134
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe 数据来源:互联网公开数据 标签:文本转写, 语言模型, 马拉地语, 印度语言, 文本处理, 自然语言处理, 机器翻译, 数据集 数据概述:...
-
语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835
2025年4月25日 30 77 47
语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835 数据来源:互联网公开数据 标签:自然语言处理,语音识别,数据集,文本转写,机器学习,人工智能,语音技术,数据科学 数据概述: 该数据集包含来自多个语音转文本模型训练项目中的语音转录数据,记录了语音信号与对应文本之间的映射关系。主要特征如下:...
-
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary
2025年4月25日 30 188 147
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:孟加拉语,罗马字,转写,数据集,自然语言处理,语言学,机器学习,文本分析 数据概述:...
-
乌克兰语音到文本数据集
2025年4月22日 30 8 7
乌克兰语音到文本数据集 数据来源:互联网公开数据 标签:乌克兰,语音到文本,语音识别,自然语言处理,机器学习,音频数据,文本转写 数据概述:...



