-
儿童英语语音录音数据集_自发语音_预设句子
2025年12月16日 30 186 155
数据集概述 该数据集包含11名幼儿(平均年龄4.9岁,5名女性、6名男性)的英语语音录音,涵盖自发讲述绘本、重复预设句子、数数三类任务,录音来源包括专业麦克风、便携麦克风及机器人麦克风,部分组合因技术问题缺失,含自发语音的人工分割标注。 文件详解 文件名称: english_children.zip 文件格式: ZIP压缩包 内容说明:...
-
德语短语结构与元音松紧度交互作用声学与发音研究数据集
2025年12月18日 30 119 42
数据集概述 该数据集是研究“德语短语结构与元音松紧度交互作用”的声学与发音学研究配套数据,包含实验数据文件和分析脚本,支持对德语语音结构与元音特征关系的定量分析。 文件详解 文本数据文件(.txt格式,共5个): di.txt、mono.txt:包含语音标注数据,字段示例有labels、start、end、utts、subject等时间与对象信息...
-
LJ语音_国际音标对齐转录数据集
2025年12月11日 30 124 107
数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
-
格鲁吉亚语语言资源数据集2018
2025年12月7日 30 177 141
数据集概述 本数据集包含2018年夏季学期在柏林洪堡大学语言学硕士课程中收集的格鲁吉亚语语言资源,包括ASJP词汇表录音、不及物动词形态形式录音及相关元数据文档,为格鲁吉亚语语言学研究提供原始语音与文本数据支持。 文件详解 词汇表录音文件组(20180528_ASJPSwadesh_HK_EP):...
-
特威语语音识别数据集
2025年10月24日 30 48 6
特威语语音识别数据集_Twi_Speech_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音数据, 特威语, 声学模型, 语言学, 语音标注, 机器学习, 音频处理 数据概述: 该数据集包含来自公开来源的特威语语音数据,旨在用于特威语语音识别系统的开发与研究。主要特征如下:...
-
印地语语音转文本数据集
2025年8月26日 30 204 77
印地语语音转文本数据集_Marathi_Speech_to_Text_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转文本, 印地语, 语言学, 声学模型, 深度学习, 数据集, 语音标注 数据概述: 该数据集包含印地语语音数据及其对应的文本转录,旨在促进印地语语音识别技术的研究与开发。主要特征如下:...
-
多语言语音词汇识别数据集
2025年7月24日 30 62 29
多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集 数据概述: 该数据集包含来自多个来源的语音数据,记录了不同语言的语音词汇及其对应的文本转录。主要特征如下:...
-
Tashkeela清理阿拉伯语带音符语料库
2025年6月1日 30 188 70
Tashkeela清理阿拉伯语带音符语料库 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,文本清洗,语音标注,语言模型,机器学习,数据标注 数据概述:...
-
波斯语语音片段数据集PersianSpeechSegments-melikasaadi
2025年5月28日 30 101 31
波斯语语音片段数据集PersianSpeechSegments-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 波斯语, 语音片段, 音频数据, 语音合成, 自然语言处理, 声学模型, 语音标注 数据概述: 该数据集包含波斯语语音片段,并附带相应的文本标注信息。主要特征如下:...
-
语音识别文本训练数据集SpeechRecognitionTextTrainingData-nikhil9999
2025年5月1日 30 12 4
语音识别文本训练数据集SpeechRecognitionTextTrainingData-nikhil9999 数据来源:互联网公开数据 标签:语音识别, 文本数据, 语音标注, 自然语言处理, 文本分析, 声音数据, 机器学习, 数据集 数据概述: 该数据集包含来自公共语音项目的数据,记录了用于语音识别模型训练的文本和相关元数据。主要特征如下:...
-
英语语音翻译验证数据集EnglishSpeechTranslationValidation-kokeyehya
2025年5月1日 30 148 44
英语语音翻译验证数据集EnglishSpeechTranslationValidation-kokeyehya 数据来源:互联网公开数据 标签:语音翻译, 英语, 阿拉伯语, 语音识别, 文本对齐, 语音标注, 多语言, 数据集 数据概述: 该数据集包含来自 kokeyehya-vedios...
-
语音数据诊断分析数据集SpeechDataDiagnosticAnalysisDataset-domi2314
2025年5月1日 30 130 4
语音数据诊断分析数据集SpeechDataDiagnosticAnalysisDataset-domi2314 数据来源:互联网公开数据 标签:语音识别, 语音分析, 医疗诊断, 语音标注, 疾病检测, 数据清洗, 机器学习, 文本处理 数据概述:...
-
越南语语音文本标注数据集VietnameseSpeechTextAnnotation-thaonguyen24303
2025年5月1日 30 6 2
越南语语音文本标注数据集VietnameseSpeechTextAnnotation-thaonguyen24303 数据来源:互联网公开数据 标签:语音识别, 语音标注, 文本分析, 越南语, 词语切分, 自然语言处理, 语料库, 数据集 数据概述:...
-
口吃语音片段幅度特征数据集StutteringSpeechAmplitudeFeatureDataset-mitulgargsam
2025年5月1日 30 191 130
口吃语音片段幅度特征数据集StutteringSpeechAmplitudeFeatureDataset-mitulgargsam 数据来源:互联网公开数据 标签:口吃, 语音分析, 幅度特征, 语音识别, 声音处理, 机器学习, 临床研究, 语音标注 数据概述:...
-
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair
2025年4月29日 30 103 90
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 语言学, 马拉雅拉姆语, 声学模型, 语音标注, 数据集 数据概述: 该数据集包含来自公开来源的马拉雅拉姆语语音数据,并附带相应的转录文本。主要特征如下:...



