-
AVP_LVT_Based_人声打击乐音频与标注数据集_扩展版
2026年1月29日 30 131 127
数据集概述 本数据集整合了AVP和LVT两个公开数据集的人声打击乐数据,包含四十八名无或极少beatbox经验参与者的音频与标注。数据扩展了原始标注,新增音节级语音标注,遵循国际音标(IPA)规范,包含音头音素与韵尾音素信息,支持人声打击乐的语音与音乐特征分析。 文件详解 文件名称:AVP-LVT_Dataset.zip 文件格式:ZIP...
-
Enggano_Based_1895年词汇表CLDF标准化数据集
2026年1月27日 30 69 30
数据集概述 本数据集为1895年Enggano词汇表的数字化CLDF格式版本,匹配了Holle List的英文及印尼语释义,包含Enggano词汇的通用正字法、原始转录、音素分割及国际音标转写等信息,适用于濒危语言词汇研究与跨语言比较分析。 文件详解 文件名称:engganolang/holle-list-enggano-1895-2.0.0.zip...
-
IPA_Transcription_印尼西芒加莱方言语音转录与录音数据
2026年1月26日 30 110 104
数据集概述 本数据集包含印度尼西亚东努沙登加拉省西芒加莱地区十个调查点的方言语音数据,采用国际音标(IPA)进行转录,同时提供对应的语音录音文件,可用于方言语音特征分析与研究,总计包含十七个文件。 文件详解 语音录音文件(MP3格式) 文件名称:包含sample of [e] sound in gloss fish.mp3、sample of [h]...
-
LJ语音_国际音标对齐转录数据集
2025年12月11日 30 169 86
数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
-
克木语逐行对照文本集220125
2025年12月14日 30 87 56
数据集概述 本数据集包含八部克木语(Kmhmu')文本,采用逐行对照格式呈现,包含国际音标(IPA)转写、英文注释及自由翻译,为克木语语言研究提供结构化语料。 文件详解 该数据集由八个PDF格式的文档文件组成,具体如下: - 文件名称及格式: - Tan Srma' - Interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件...
-
西波莱西亚语料库中名词_person_的标记数据集
2025年12月10日 30 153 9
数据集概述 该数据集包含西波莱西亚语料库自由文本中名词"person"的所有标记。数据由Kristian Roncero于二零一六年一月至二零一七年六月在白俄罗斯布列斯特地区收集,采用国际音标(IPA)规范表示,标记存在腭化与非腭化变体及不一致的元音表现。 文件详解 文件名称: PERSON_CORPUS.pdf 文件格式: PDF (.pdf)...
-
THCHS_30_国际音标对齐转录数据集
2025年12月4日 30 43 41
数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...
-
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib
2025年5月1日 30 21 13
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib 数据来源:互联网公开数据 标签:孟加拉语, 语音学, 语言学, 国际音标, 文本转录, 自然语言处理, 数据集, 语音识别 数据概述:...
-
孟加拉语语音转录词汇数据集BanglaSpeechTranscriptionVocabulary-tanbeerjubaer
2025年4月29日 30 28 1
孟加拉语语音转录词汇数据集BanglaSpeechTranscriptionVocabulary-tanbeerjubaer 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 词汇, 数据集, 自然语言处理 数据概述: 该数据集包含来自tanbeerjubaer-dataverse-...
-
孟加拉语语音转录数据集BanglatoIPA-jakir57
2025年4月29日 30 210 24
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:...
-
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09
2025年4月29日 30 187 167
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 国际音标, 文本处理, 自然语言处理, 声学模型 数据概述:...
-
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix
2025年4月23日 30 166 125
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix 数据来源:互联网公开数据 标签:德语,发音,国际音标,词典,语言学,语音学,数据集,语音识别 数据概述:该数据集包含德语单词及其对应的国际音标(IPA)发音信息,旨在为德语语音研究和语音合成提供基础数据。主要特征如下:...



