-
农业教育医学领域自动标引评估资源语料库与黄金标准索引数据集
数据集概述 该数据集包含农业、教育、医学三个领域的语料库及其对应的黄金标准索引,用于自动标引系统的评估。每个领域语料库含不同规模的文档集合,文档包含标题、摘要等元数据,黄金标准索引来自各领域专业数据库。 文件详解 文件名称:Corpora+Gold_Standard_Index.zip 文件格式:ZIP(.zip) 包含内容:...
-
大众媒体中人群事故报道数据集
数据集概述 该数据集包含对人群事故相关新闻报道语料库的分析结果,按类别组织文件以支持在线可视化和离线分析。内容涵盖新闻报道源信息、维基百科语料库、词汇分析结果及情感分析数据,为研究媒体对人群事故的呈现提供多维度支持。 文件详解 分类0(0_data_all.zip):所有文件的结构化压缩包,便于直接下载和分析,包含词汇分析、情感分析等全部数据。...
-
环境破坏语料库情感分析数据集
数据集概述 本数据集是环境文学研究论文配套的情感分析数据,包含12个文件,涵盖环境破坏主题文本的情感分析结果表格及可视化图表,支持对相关文学文本情感倾向的分析研究。 文件详解 数据文件(CSV格式,共3个): LeGuin Sentiment.csv:包含页面(Page)、句子(Sentence)等字段,记录LeGuin文本的情感分析数据 Van...
-
H2020_ICT领域游戏与游戏化话语分析语料库数据集
数据集概述 该数据集是用于分析H2020 ICT领域官方话语的语料库,旨在识别整体及游戏和游戏化子领域的优先事项、隐性偏见与未探讨假设。分析基于社会科学与人文方法,相关研究成果可通过指定链接获取。 文件详解 政策文件(PDF格式,共四个文件): H2020_overarching strategy.pdf:H2020总体战略文件 H2020_in...
-
杜洪比宗教文本与歌曲转录解析数据集
数据集概述 本数据集包含杜洪比语的宗教文本与歌曲相关数据,涵盖录音文件、转录文件、解析文件及翻译文件等多种格式,对应佛教训诫、苯教预言文本和即兴歌曲三类内容,为杜洪比语研究提供多维度资源。 文件详解 数据集包含多种格式的文件,具体说明如下: -...
-
罗伯特_舒曼歌曲集带注释乐谱语料库
数据集概述 本数据集为罗伯特·舒曼《歌曲集》的带注释乐谱语料库,包含经过标注的乐谱资源,以压缩包形式存储,为音乐学研究、乐谱分析及相关领域提供专业数据支持。 文件详解 文件名称:DCMLab/schumann_liederkreis-v2.5.zip 文件格式:ZIP(.zip)...
-
MIRTEMIR_SHE_RIYATI_Based_诗歌文本资料完整数据
数据集概述 该数据集包含一份关于MIRTEMIR诗歌的文档,以PDF格式存储,未提供具体描述内容,主要用于呈现与MIRTEMIR诗歌相关的文本信息。 文件详解 文件名称: Abdurahmonova Mavluda .pdf 文件格式: PDF (.pdf) 文件内容: 文档类文件,推测包含与MIRTEMIR诗歌相关的文本内容,具体字段及结构未提供...
-
尼古拉_梅特纳_叙事曲_带注释乐谱语料库
数据集概述 该数据集为尼古拉·梅特纳叙事曲的带注释乐谱语料库,包含相关音乐作品的注释乐谱资源,以压缩文件形式存储,为音乐研究和分析提供基础数据支持。 文件详解 文件名称: DCMLab/medtner_tales-v2.3.zip 文件格式: ZIP(压缩文件) 内容说明:...
-
基于大语言模型重写故事的葡萄牙语叙事性别偏见研究数据集
数据集概述 本数据集为葡萄牙语文学作品语料库,用于研究大语言模型生成叙事中的性别偏见。语料库含五百九十二部作品,经筛选后得两万八千三百一十七个句子、七十七万四千五百一十六个词,作品覆盖不同历史时期与文学风格,每部最多取一百句以平衡分布。 文件详解...
-
iRealPro爵士标准曲语料库
数据集概述 该数据集为iRealB爵士标准曲语料库的首次发布,包含一千一百八十六个kern格式文件。提供了关于文件转换过程及基础描述性统计的相关说明文档链接,是爵士音乐研究的基础数据资源。 文件详解 文件名称: shanahdt/irealb-v1.0.zip 文件格式: ZIP压缩包 内容说明:...
-
哥伦比亚2021年青年议会选举语料库
数据集概述 该数据集为2021年哥伦比亚青年议会选举语料库(CJ21),包含34963名14-28岁候选人提交的6496份行动计划(共10641646个词元),覆盖全国33个省的1009个市镇,涵盖政党及运动、组织流程与实践、独立青年名单三种提交形式。 文件详解 文件名称:CJ21_v1_6496.zip 文件格式:ZIP(.zip)...
-
InVID_Project_InVID_Fake_Video_Based_虚假视频检测训练数据集
数据集概述 该数据集是InVID项目开发的小型已验证虚假视频语料库,包含五十九个视频的URL和元数据,记录了每个视频的虚假类型、原始来源及证明其为虚假的证据,旨在呈现现实世界中可能遇到的虚假视频类型。 文件详解 文件名称: Fake Video Corpus.zip 文件格式: ZIP压缩包 内容说明:...
-
电子版世界英语变体地图集数据集2020
数据集概述 该数据集是电子版世界英语变体地图集(EWAVE)的CLDF格式压缩包,包含与英语变体相关的语言资源,可能涉及语音数据(WAV格式音频),为研究全球英语变体提供标准化数据支持。 文件详解 文件名称: cldf-datasets/ewave-v3.0.zip 文件格式: ZIP压缩包 文件内容: 压缩包可能包含遵循CLDF(Cross-...
-
塞尔维亚语名物化对标注数据库
数据集概述 该数据集基于塞尔维亚网络语料库CLASSLA-web.sr提取的四千一百三十二条语料行,对塞尔维亚语中的动词性名物化进行标注,包含六十个本土-nje名物化和二十个拉丁语源-cija名物化,形成特定配对,用于研究其形态句法特征。 文件详解 文件名称: Description_Annotated database of...
-
威廉_弗里德曼_巴赫钢琴奏鸣曲标注乐谱语料库
数据集概述 该数据集为威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱语料库,包含一个压缩文件,未提供详细内容描述,主要用于音乐研究与乐谱分析场景。 文件详解 文件名称:wf_bach_sonatas-v2.3.zip 文件格式:ZIP(.zip) 内容说明:压缩文件,包含威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱相关数据,具体字段及内容需解压后查看 适用场景...
-
法德媒体中女性政治人物报道研究数据集2014
数据集概述 本数据集收录了二零零五年至二零零七年期间,法国和德国共十六家主流媒体(八家法国媒体、八家德国媒体)报道安格拉·默克尔与塞戈莱娜·罗亚尔的一万两千六百篇文章中,涉及的称谓、传记信息及新词,是二零一四年出版的相关研究著作的基础语料库。 文件详解 主要数据文件(.ods格式,共一百八十七个):...
-
旁遮普方言语音数据集
数据集概述 本数据集包含旁遮普方言的语音录音数据,同时提供相关的模型代码文件,为旁遮普方言语音研究提供基础数据支持。 文件详解 文件名称: FemaleMale.html 文件格式: HTML (.html) 内容说明: 包含与旁遮普方言语音模型相关的代码 文件名称: Dataset.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
-
德语复数数据集
数据集概述 本数据集核心内容围绕德语复数相关主题,具体数据内容未提供详细描述,以压缩文件形式存储。 文件详解 文件名称: zenodo.zip 文件格式: ZIP压缩文件 内容说明: 包含数据集的核心文件,具体字段及内容未提供预览信息 适用场景 德语语言学研究: 可用于分析德语复数形式的构成规则或语法特征 自然语言处理研究:...
-
冰岛语社会语言学田野调查数据集2019
数据集概述 本数据集是2019年科隆大学“科隆城市田野调查”语言学学士研讨会的冰岛语研究成果,包含社会语言学问卷、斯瓦迪士词汇表录音及数字二和五的结构化诱发实验数据,支持冰岛语社会语言学特征分析。 文件详解 文档类文件(PDF格式):...
-
乌兹别克语与英语地名_人名及其他专名单位比较研究数据集
数据集概述 本数据集围绕乌兹别克语与英语中的地名、人名及其他专名单位展开比较研究,包含一篇核心研究文档,为语言学领域中专名系统的跨语言对比分析提供资料支持。 文件详解 文件名称: Begmatov Azizbek Tursunbayevich.pdf 文件格式: PDF (.pdf) 文件内容:...



