找到18个数据集

标签: 音频转录

过滤结果
  • Interruption_Based_手动标注会议打断音频转录数据集2024

    2026年1月20日 30 143 95

    数据集概述 本数据集改编自加拿大菲沙河谷大学创建的Group Affect and Performance数据集,包含手动标注的重叠话语(分为真实打断和非真实打断)音频文件、结构化标注数据及原始完整会议音频与转录文本。数据源于14组会议,从355个重叠话语实例中筛选出200个真实打断,支持对话打断行为的分析研究。 文件详解...
    packageimg
  • Telegram_Based_2023年9月26日至10月31日频道消息档案数据

    2026年1月19日 30 62 37

    数据集概述 本数据集包含2023年9月26日至10月31日期间Telegram平台某频道的消息档案,涵盖143个用户发送的2609条消息,类型包括文本、转录音频、图片、视频和数字贴纸,为研究该时间段内频道的信息传播特征提供基础数据。 文件详解 文件名称:Kurjeru forums B_Open data.xlsx 文件格式:XLSX...
    packageimg
  • GECKO_MSCA_ITN_智能家居技术协同设计专业人员与用户焦点小组访谈数据

    2026年1月15日 30 189 1

    数据集概述 本数据集为博士研究中智能家居技术协同设计研究的第三部分,记录了针对专业人员、早期采用者及晚期/非采用者开展的在线焦点小组访谈内容,旨在细化干预方案的设计细节、参与人员及实施方式。 文件详解 文件名称:P3_FG-PAN-TRANSCR_R00.docx 文件格式:DOCX...
    packageimg
  • 图书馆学与信息科学领域播客研究方法论数据集

    2025年12月21日 30 38 8

    数据集概述 本数据集为播客民族志研究方法相关论文提案所用数据,聚焦图书馆学与信息科学领域,探讨播客作为声音文档的特性,提出播客民族志研究框架,包含数据收集分析工具、田野日记模板、研究时间表等资源,支撑播客相关研究。 文件详解 核心研究文件: DOC SUPLEMENTAR.docx:补充文档,可能包含研究提案的详细内容、理论框架或方法论说明...
    packageimg
  • 自动音频转录工具概述及转录文本数据集2022

    2025年12月19日 30 14 8

    数据集概述 本数据集包含2022年3月对多款自动音频转录工具的综合评估,涉及工具功能、成本、安全性等信息,同时提供荷兰语测试音频片段及各工具生成的原始转录文本与人工清理文本,为研究自动转录工具性能提供实证数据。 文件详解 工具概述文件...
    packageimg
  • 自动医疗转录数据集

    2025年12月16日 30 50 3

    数据集概述 该数据集用于训练机器学习模型,从医患对话中自动生成精神科病例记录。通过学生模拟录制对话音频,经AI语音识别生成转录文本,并由学生基于转录文本撰写病例记录,为医疗转录自动化研究提供数据支持。 文件详解 文件名称: nazmulkazi/dataset_automated_medical_transcription-v1.0.zip 文件格式:...
    packageimg
  • 智能家居技术协同设计第一部分工作坊数据集

    2025年12月15日 30 199 125

    数据集概述 本数据集是博士研究项目“智能家居技术协同设计”的第一部分,包含针对智能家居技术开发者、早期 adopters 及晚期/非 adopters 三类群体开展的独立线下工作坊所收集的定性数据,涵盖音频转录文本与参与者生成的视觉资料。 文件详解 该数据集包含三类工作坊的文档文件,具体说明如下: - 专业开发者工作坊文档: - P1_WSP-PRO-...
    packageimg
  • IIT_Madras_Mridangam_Tani_avarthanam_Based_塔尼阿瓦坦哈姆打击乐演奏数据集

    2025年12月12日 30 21 20

    数据集概述 本数据集包含由著名Mridangam大师Padmavibhushan Umayalpuram K. Sivaraman演奏的两段Tani-avarthanam的转录内容,音频录制于印度IIT Madras,由专业卡纳提克打击乐手进行标注,提供打击乐节奏模式的音节化表示。 文件详解 文件名称: mridangam_tani-...
    packageimg
  • 旺格罗格弗里西亚语语料库

    2025年12月12日 30 202 84

    数据集概述 该数据集为旺格罗格弗里西亚语语料库,包含1807-1935年收集的文本记录及1924-1927年音频转录内容,总文本量约十万五千五百词,覆盖该语言现存主要文献,为研究已消亡的德国北部弗里西亚语言提供数据支持。 文件详解 README.md:Markdown格式文档,介绍语料库核心内容、结构及使用说明...
    packageimg
  • PHENICX_Anechoic_交响乐团消声录音音符标注数据集

    2025年12月11日 30 73 63

    数据集概述 本数据集包含交响乐团消声录音的音符标注,适用于音乐信息检索任务,如乐谱辅助声源分离、乐谱跟随、多音高估计、转录及乐器检测。数据由PHENICX项目提供,包含去噪后的部分消声录音、音符起止标注及多麦克风录音配置文件。 文件详解 文件名称: PHENICX-Anechoic_1.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 软件行业年轻从业者绿色编码知识需求研究音频转录文件

    2025年12月9日 30 64 57

    数据集概述 本数据集为一份完整的音频转录文件,包含转录者注释,围绕软件行业年轻从业者所需的绿色编码知识需求展开,基于相关研究的访谈或讨论内容,提供定性研究的原始文本数据支持。 文件详解 文件名称: Supplementary_Material_Full_Audio_Transcript_with_Transcriptors_Notes.pdf...
    packageimg
  • 杜洪比程序性文本转录解析与翻译数据集

    2025年12月8日 30 30 10

    数据集概述 本数据集包含杜洪比语程序性文本的多格式文件,涉及狩猎豪猪、制作发酵大豆等七种活动的录音及对应转录、解析、注释与翻译内容,配套语法说明及工具配置文件,为语言研究提供支撑。 文件详解 核心数据文件: 音频文件(.wav):7个,对应七种活动的原始录音,如CHUK220413A1.wav(捕蛙)...
    packageimg
  • 语音识别Whisper模型输出数据集SpeechRecognitionWhisperModelOutputDataset-sanliu

    2025年5月1日 30 210 3

    语音识别Whisper模型输出数据集SpeechRecognitionWhisperModelOutputDataset-sanliu 数据来源:互联网公开数据 标签:语音识别, Whisper模型, 音频转录, 语音转文本, 模型输出, 文本数据, 深度学习, 自然语言处理 数据概述:...
    packageimg
  • 印度地区音频转录文本数据集IndiaRegionalAudioTranscriptionText-pranav51286

    2025年5月1日 30 96 88

    印度地区音频转录文本数据集IndiaRegionalAudioTranscriptionText-pranav51286 数据来源:互联网公开数据 标签:音频转录, 语音识别, 印度, 印地语, 文本分析, 自然语言处理, 语料库, 语言学 数据概述: 该数据集包含来自印度地区的音频转录文本,记录了印地语的语音内容及其对应的文字转录。主要特征如下:...
    packageimg
  • 播客访谈内容时间戳数据集PodcastInterviewTranscriptTimestamps-drmatters

    2025年4月29日 30 10 4

    播客访谈内容时间戳数据集PodcastInterviewTranscriptTimestamps-drmatters 数据来源:互联网公开数据 标签:播客, 访谈, 文本分析, 时间戳, 音频转录, 语音识别, 对话分析, Joe Rogan 数据概述: 该数据集包含来自 Joe Rogan...
    packageimg
  • 印度地区音频转录文本数据集IndianRegionalAudioTranscript-pranav51286

    2025年4月29日 30 11 8

    印度地区音频转录文本数据集IndianRegionalAudioTranscript-pranav51286 数据来源:互联网公开数据 标签:语音识别, 文本转录, 印度, 印地语, 语言学, 文本分析, 音频数据, 数据标注 数据概述: 该数据集包含来自印度地区的音频转录文本,记录了不同音频文件的转录内容。主要特征如下:...
    packageimg
  • 语音转录文本数据集SpeechTranscriptionTextDataset-yumoan

    2025年4月29日 30 154 129

    语音转录文本数据集SpeechTranscriptionTextDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本数据, Whisper模型, 语音处理, 自然语言处理, 数据集, 音频转录 数据概述:...
    packageimg
  • 语音识别转录音频数据集SpeechRecognitionTranscriptionAudioDataset-sanliu

    2025年4月29日 30 182 132

    语音识别转录音频数据集SpeechRecognitionTranscriptionAudioDataset-sanliu 数据来源:互联网公开数据 标签:语音识别, 音频转录, 声学模型, 语音数据, 数据集, 深度学习, 自然语言处理, 语音处理 数据概述: 该数据集包含来自公开渠道的语音数据,记录了语音信号及其对应的文本转录。主要特征如下:...
    packageimg