-
北萨米语广播字幕语料库_2021_2024
2026年2月1日 30 181 95
数据集概述 本数据集为北萨米语YLE Areena字幕语料库,包含2021年3月31日至2024年11月15日期间从YLE Sápmi广播收集的北萨米语字幕句子,涵盖完整句子、句子ID及来源元数据,可用于北萨米语语言研究与资源开发。 文件详解 文件名称:sami_subtitles.json 文件格式:JSON...
-
Speech_Intelligibility_Based_频谱退化句子语音清晰度实验原始数据
2026年1月12日 30 209 160
数据集概述 本数据集记录了频谱退化句子的语音清晰度实验数据,旨在探究振幅与相位信息对语音清晰度的差异化贡献。实验中听者需在听取频谱退化的句子后完成单词识别任务,刺激通过分割句子、独立解相关各片段的振幅与相位成分生成,包含三种片段长度:30毫秒(音素长度)、250毫秒(音节长度)及完整句子(未分割)。 文件详解 原始数据文件(30毫秒窗口)...
-
塞尔维亚语名物化对标注数据库
2025年12月10日 30 75 14
数据集概述 该数据集基于塞尔维亚网络语料库CLASSLA-web.sr提取的四千一百三十二条语料行,对塞尔维亚语中的动词性名物化进行标注,包含六十个本土-nje名物化和二十个拉丁语源-cija名物化,形成特定配对,用于研究其形态句法特征。 文件详解 文件名称: Description_Annotated database of...
-
英语名物化对标注数据库
2025年12月8日 30 7 1
数据集概述 该数据集是基于英国网络语料库(ukWaC)提取的3440条索引行,对英语中40个名物化词元(20个-ing形式、20个-(t)ion形式)的标注数据库。名物化按相同词根配对,用于研究英语事件性名物化的动词属性表现。 文件详解 文件名称: Annotated database of nominalization pairs in...



