找到79个数据集

标签: 语音转录

过滤结果
  • PHON_Replication_Data_西班牙语_加泰罗尼亚语学习者英语发音准确性影响因素研究数据集

    2026年1月1日 30 145 70

    数据集概述 本数据集为英语作为外语发音准确性影响因素研究的复现数据,包含西班牙语-加泰罗尼亚语中级学习者的英语单词发音语音转录分析。数据记录学习者发音表现,支持探究发音准确性的影响因素,包含2个文件,覆盖数据与说明文档两类内容。 文件详解 README.txt 文件格式:TXT...
    packageimg
  • LJ语音_国际音标对齐转录数据集

    2025年12月11日 30 26 13

    数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
    packageimg
  • 开罗Darb_al_Ahmar地区Leyla阿拉伯语与法语录音描述及评论转录数据集2011_10_27

    2025年12月10日 30 34 25

    数据集概述 本数据集包含2011年10月27日埃及开罗Darb al-Ahmar地区参与者Leyla的录音描述及评论转录文件,涵盖阿拉伯语原文及法语译文,是“耳朵里的麦克风”双耳听觉实验的一部分,记录了参与者对自身录制城市声音路线的后验反馈。 文件详解 压缩文件: Archive Word docs Arabic & French...
    packageimg
  • CitySpeechMix语音与城市声音混合模拟数据集

    2025年12月7日 30 136 80

    数据集概述 本数据集是模拟音频数据集,将LibriSpeech的语音片段与SONYC-UST的环境录音混合,生成语音与背景噪声的受控混合数据。包含三百七十一条混合音频和三百七十一条无语音城市环境录音,每条音频时长十秒,附语音转录和环境声音类别标签。 文件详解 压缩文件: cityspeechmix.zip: 包含数据集核心内容,分为两个子文件夹...
    packageimg
  • THCHS_30_国际音标对齐转录数据集

    2025年12月4日 30 148 42

    数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...
    packageimg
  • 格鲁吉亚语语音片段数据集

    2025年10月5日 30 48 2

    格鲁吉亚语语音片段数据集_Georgian_Speech_Segments_Dataset 数据来源:互联网公开数据 标签:语音识别, 声学模型, 语音数据, 格鲁吉亚语, 语音转录, 机器学习, 语料库, 音频分析 数据概述: 该数据集包含来自格鲁吉亚语的语音片段,记录了不同说话人的语音录音及其对应的文本转录。主要特征如下:...
    packageimg
  • 阿拉伯语口语语音转录数据集

    2025年9月16日 30 89 36

    阿拉伯语口语语音转录数据集_Arabic_Spoken_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 口语, 阿拉伯语, 语音转录, 声学模型, 语言学, 情感分析, 埃及阿拉伯语 数据概述: 该数据集包含来自公开渠道的阿拉伯语口语语音数据,并附带相应的文本转录信息。主要特征如下:...
    packageimg
  • 白俄罗斯语语音转录数据集

    2025年8月15日 30 128 117

    白俄罗斯语语音转录数据集_Belarusian_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 语音合成, 声学模型, 语言模型, 白俄罗斯语, 语音数据, 深度学习 数据概述:...
    packageimg
  • 人工智能教学视频语音转录数据集

    2025年8月6日 30 20 13

    人工智能教学视频语音转录数据集_Artificial_Intelligence_Teaching_Video_Speech_Transcription 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 文本分析, 机器学习, 教学视频, 语音转录, 数据标注, 数据集 数据概述:...
    packageimg
  • 阿拉伯语语音转录数据集

    2025年7月30日 30 98 9

    阿拉伯语语音转录数据集_Arabic_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 阿拉伯语, 声学模型, 文本分析, 多模态数据, 语音情感, 数据标注 数据概述: 该数据集包含阿拉伯语语音数据及其对应的文本转录,旨在为语音识别和相关研究提供支持。主要特征如下:...
    packageimg
  • 印地语语音转录数据集

    2025年7月7日 30 84 2

    印地语语音转录数据集_Hindi_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 印地语, 声学模型, 语言模型, 语音数据集, 深度学习, 印度 数据概述: 该数据集包含来自多个来源的印地语语音数据,记录了印地语语音的音频文件及其对应的文本转录。主要特征如下:...
    packageimg
  • 越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset

    2025年6月23日 30 160 65

    越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 越南语, 语音数据集, 文本标注, 自然语言处理, 声学模型, 深度学习 数据概述:...
    packageimg
  • 多语言语音转录数据集

    2025年5月31日 30 138 112

    多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:...
    packageimg
  • 马达加斯加语语音转录数据集MalagasySpeech-to-TextDataset-misandratrarazafy

    2025年5月29日 30 83 76

    马达加斯加语语音转录数据集MalagasySpeech-to-TextDataset-misandratrarazafy 数据来源:互联网公开数据 标签:语音识别, 语音转录, 马达加斯加语, 声学模型, 语言模型, 语音数据, 机器学习, 自然语言处理 数据概述: 该数据集包含马达加斯加语的语音音频及其对应的文本转录,旨在为语音识别(Speech-...
    packageimg
  • Aditi1024文本转录数据集-donutkashvi

    2025年5月29日 30 74 72

    Aditi1024文本转录数据集-donutkashvi 数据来源:互联网公开数据 标签:文本转录,语音识别,数据集,印度语,转录质量,自然语言处理,音频分析,机器学习 数据概述: 该数据集包含来自Aditi 1024项目收集的印度语音频及其相应的文本转录。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了不同时间段的音频数据。...
    packageimg
  • 孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506

    2025年5月29日 30 178 151

    孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音数据, 文本数据, 语音转录, 自然语言处理, 深度学习, 声学模型 数据概述:...
    packageimg
  • 语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511

    2025年5月29日 30 197 128

    语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511 数据来源:互联网公开数据 标签:语音识别, 文本转录, Whisper模型, 语音分析, 文本校对, 数据清洗, 声学模型, 自然语言处理 数据概述:...
    packageimg
  • 阿拉伯语音频转录数据集ArabicSpeechTranscriptionDataset-youssefemad004

    2025年5月29日 30 95 40

    阿拉伯语音频转录数据集ArabicSpeechTranscriptionDataset-youssefemad004 数据来源:互联网公开数据 标签:语音识别, 语音转录, 阿拉伯语, 自然语言处理, 声音数据, 深度学习, 语料库, 文本分析 数据概述:...
    packageimg
  • 音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan

    2025年5月29日 30 108 105

    音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:...
    packageimg
  • 古兰经音频转录数据集QuranAudioTranscriptionDataset-haithamalhaji

    2025年5月28日 30 95 1

    古兰经音频转录数据集QuranAudioTranscriptionDataset-haithamalhaji 数据来源:互联网公开数据 标签:语音识别, 语音转录, 阿拉伯语, 古兰经, 深度学习, 音频数据, 数据集, 文本分析 数据概述: 该数据集包含来自公开渠道的古兰经诵读音频及其对应的文本转录。主要特征如下:...
    packageimg