找到1,513个数据集

标签: 语料库

过滤结果
  • 克劳迪奥_蒙特威尔第牧歌标注乐谱语料库

    2025年12月11日   

    数据集概述 该数据集为克劳迪奥·蒙特威尔第的牧歌作品提供了标注乐谱语料库,包含经过整理和标注的音乐乐谱资源,以压缩文件形式存储,便于获取和使用。 文件详解 文件名称: DCMLab/monteverdi_madrigals-v2.3.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 法语与英语借词语料库_法语4990期末论文用

    2025年12月11日   

    数据集概述 该数据集为法语4990期末论文设计,包含法语与英语借词语料库,重点关注/dʒ/、/tʃ/、/h/、/ɦ/、/θ/、/ð/等特定音素相关的借词,为语言对比研究提供支持。 文件详解 文件名称:Fren 4990 List of Loanwords Aug 2024.pdf 文件格式:PDF...
    packageimg
  • 数据2019年科隆城市田野调查数据集

    2025年12月11日   

    数据集概述 该数据集为2019年科隆城市田野调查项目的子项目,聚焦科隆地区的韩语使用情况及一位韩语使用者的语言研究,包含带注释的词汇表、韩语语音层级诱发实验的音频及文本文件。 文件详解 该数据集包含8个文件,具体说明如下: - 项目文档类(PDF格式): -...
    packageimg
  • STIMTEC与STIMTEC_X项目日常报告数据集

    2025年12月11日   

    数据集概述 本数据集包含STIMTEC和STIMTEC-X项目期间,德国弗莱贝格Reiche Zeche研究矿场的日常活动报告。数据以PDF格式为主,辅以说明文档,记录了实验开展情况与设备设置,为研究项目执行过程提供详细记录。 文件详解 文件名称: READ_ME.txt 文件格式: TXT (.txt) 内容概述:...
    packageimg
  • 杜洪比语讨论转录解析与翻译文本数据集

    2025年12月11日   

    数据集概述 该数据集包含杜洪比语讨论的音频文件、转录文件、解析文件及翻译文件,对应《杜洪比语语法》(2020)中的三个文本案例,支持通过工具同步查看音频与文本内容,为杜洪比语研究提供多格式语言数据。 文件详解 音频文件: CHUK260413A2A.wav、CHUK300412J2.wav,格式为WAV,对应讨论的原始录音 转录文件:...
    packageimg
  • 农业教育医学领域自动标引评估资源语料库与黄金标准索引数据集

    2025年12月11日   

    数据集概述 该数据集包含农业、教育、医学三个领域的语料库及其对应的黄金标准索引,用于自动标引系统的评估。每个领域语料库含不同规模的文档集合,文档包含标题、摘要等元数据,黄金标准索引来自各领域专业数据库。 文件详解 文件名称:Corpora+Gold_Standard_Index.zip 文件格式:ZIP(.zip) 包含内容:...
    packageimg
  • 大众媒体中人群事故报道数据集

    2025年12月10日   

    数据集概述 该数据集包含对人群事故相关新闻报道语料库的分析结果,按类别组织文件以支持在线可视化和离线分析。内容涵盖新闻报道源信息、维基百科语料库、词汇分析结果及情感分析数据,为研究媒体对人群事故的呈现提供多维度支持。 文件详解 分类0(0_data_all.zip):所有文件的结构化压缩包,便于直接下载和分析,包含词汇分析、情感分析等全部数据。...
    packageimg
  • 环境破坏语料库情感分析数据集

    2025年12月10日   

    数据集概述 本数据集是环境文学研究论文配套的情感分析数据,包含12个文件,涵盖环境破坏主题文本的情感分析结果表格及可视化图表,支持对相关文学文本情感倾向的分析研究。 文件详解 数据文件(CSV格式,共3个): LeGuin Sentiment.csv:包含页面(Page)、句子(Sentence)等字段,记录LeGuin文本的情感分析数据 Van...
    packageimg
  • H2020_ICT领域游戏与游戏化话语分析语料库数据集

    2025年12月10日   

    数据集概述 该数据集是用于分析H2020 ICT领域官方话语的语料库,旨在识别整体及游戏和游戏化子领域的优先事项、隐性偏见与未探讨假设。分析基于社会科学与人文方法,相关研究成果可通过指定链接获取。 文件详解 政策文件(PDF格式,共四个文件): H2020_overarching strategy.pdf:H2020总体战略文件 H2020_in...
    packageimg
  • 杜洪比宗教文本与歌曲转录解析数据集

    2025年12月10日   

    数据集概述 本数据集包含杜洪比语的宗教文本与歌曲相关数据,涵盖录音文件、转录文件、解析文件及翻译文件等多种格式,对应佛教训诫、苯教预言文本和即兴歌曲三类内容,为杜洪比语研究提供多维度资源。 文件详解 数据集包含多种格式的文件,具体说明如下: -...
    packageimg
  • 罗伯特_舒曼歌曲集带注释乐谱语料库

    2025年12月10日   

    数据集概述 本数据集为罗伯特·舒曼《歌曲集》的带注释乐谱语料库,包含经过标注的乐谱资源,以压缩包形式存储,为音乐学研究、乐谱分析及相关领域提供专业数据支持。 文件详解 文件名称:DCMLab/schumann_liederkreis-v2.5.zip 文件格式:ZIP(.zip)...
    packageimg
  • MIRTEMIR_SHE_RIYATI_Based_诗歌文本资料完整数据

    2025年12月10日   

    数据集概述 该数据集包含一份关于MIRTEMIR诗歌的文档,以PDF格式存储,未提供具体描述内容,主要用于呈现与MIRTEMIR诗歌相关的文本信息。 文件详解 文件名称: Abdurahmonova Mavluda .pdf 文件格式: PDF (.pdf) 文件内容: 文档类文件,推测包含与MIRTEMIR诗歌相关的文本内容,具体字段及结构未提供...
    packageimg
  • 尼古拉_梅特纳_叙事曲_带注释乐谱语料库

    2025年12月10日   

    数据集概述 该数据集为尼古拉·梅特纳叙事曲的带注释乐谱语料库,包含相关音乐作品的注释乐谱资源,以压缩文件形式存储,为音乐研究和分析提供基础数据支持。 文件详解 文件名称: DCMLab/medtner_tales-v2.3.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • 基于大语言模型重写故事的葡萄牙语叙事性别偏见研究数据集

    2025年12月10日   

    数据集概述 本数据集为葡萄牙语文学作品语料库,用于研究大语言模型生成叙事中的性别偏见。语料库含五百九十二部作品,经筛选后得两万八千三百一十七个句子、七十七万四千五百一十六个词,作品覆盖不同历史时期与文学风格,每部最多取一百句以平衡分布。 文件详解...
    packageimg
  • iRealPro爵士标准曲语料库

    2025年12月10日   

    数据集概述 该数据集为iRealB爵士标准曲语料库的首次发布,包含一千一百八十六个kern格式文件。提供了关于文件转换过程及基础描述性统计的相关说明文档链接,是爵士音乐研究的基础数据资源。 文件详解 文件名称: shanahdt/irealb-v1.0.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 哥伦比亚2021年青年议会选举语料库

    2025年12月10日   

    数据集概述 该数据集为2021年哥伦比亚青年议会选举语料库(CJ21),包含34963名14-28岁候选人提交的6496份行动计划(共10641646个词元),覆盖全国33个省的1009个市镇,涵盖政党及运动、组织流程与实践、独立青年名单三种提交形式。 文件详解 文件名称:CJ21_v1_6496.zip 文件格式:ZIP(.zip)...
    packageimg
  • InVID_Project_InVID_Fake_Video_Based_虚假视频检测训练数据集

    2025年12月10日   

    数据集概述 该数据集是InVID项目开发的小型已验证虚假视频语料库,包含五十九个视频的URL和元数据,记录了每个视频的虚假类型、原始来源及证明其为虚假的证据,旨在呈现现实世界中可能遇到的虚假视频类型。 文件详解 文件名称: Fake Video Corpus.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 电子版世界英语变体地图集数据集2020

    2025年12月10日   

    数据集概述 该数据集是电子版世界英语变体地图集(EWAVE)的CLDF格式压缩包,包含与英语变体相关的语言资源,可能涉及语音数据(WAV格式音频),为研究全球英语变体提供标准化数据支持。 文件详解 文件名称: cldf-datasets/ewave-v3.0.zip 文件格式: ZIP压缩包 文件内容: 压缩包可能包含遵循CLDF(Cross-...
    packageimg
  • 塞尔维亚语名物化对标注数据库

    2025年12月10日   

    数据集概述 该数据集基于塞尔维亚网络语料库CLASSLA-web.sr提取的四千一百三十二条语料行,对塞尔维亚语中的动词性名物化进行标注,包含六十个本土-nje名物化和二十个拉丁语源-cija名物化,形成特定配对,用于研究其形态句法特征。 文件详解 文件名称: Description_Annotated database of...
    packageimg
  • 威廉_弗里德曼_巴赫钢琴奏鸣曲标注乐谱语料库

    2025年12月10日   

    数据集概述 该数据集为威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱语料库,包含一个压缩文件,未提供详细内容描述,主要用于音乐研究与乐谱分析场景。 文件详解 文件名称:wf_bach_sonatas-v2.3.zip 文件格式:ZIP(.zip) 内容说明:压缩文件,包含威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱相关数据,具体字段及内容需解压后查看 适用场景...
    packageimg