数据集

语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k

数据来源：互联网公开数据

标签：语音识别, 语音数据, 文本标注, 声学模型, 自然语言处理, 语音合成, 机器学习, 语料库

数据概述：该数据集包含来自 Common Voice 项目的语音数据，记录了用于语音识别任务的语音样本及其对应的文本转录。主要特征如下：时间跨度：数据未明确标注具体时间，可视为静态语音语料库。地理范围：数据来自全球范围内的用户贡献，涵盖多种口音和语言。数据维度：数据集包括“filename”（音频文件名）、“text”（文本转录）、“up_votes”（支持票数）、“down_votes”（反对票数）、“age”（年龄段）、“gender”（性别）、“accent”（口音）和“duration”（时长）等字段。数据格式：数据以 CSV 格式提供，文件名为 cv-valid-test.csv，包含音频文件及其对应的文本标注信息。音频文件为 MP3 格式。该数据集特别适合用于语音识别模型的训练、测试和评估，以及语音合成、声纹识别等相关研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于语音识别、语音合成、声纹识别等领域的研究，如声学模型优化、多语言语音处理、口音识别等。行业应用：为语音助手、智能家居、语音搜索等行业提供数据支持，尤其在语音转文本（STT）技术、语音交互界面开发等方面具备实用性。决策支持：支持语音相关产品与服务的性能评估，帮助优化语音识别准确率和用户体验。教育和培训：作为语音处理、机器学习、自然语言处理等课程的实训素材，用于学生进行模型训练、算法验证和项目实践。此数据集特别适合用于测试语音识别模型的性能，评估不同口音、性别、年龄段语音的识别准确率，以及探索语音数据在不同应用场景中的表现。

数据与资源

versions_20250312234322.zipZIP
132.95 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	132.95 MiB
最后更新	2025年5月30日
创建于	2025年5月30日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k

数据与资源

附加信息

注册成功！