找到22个数据集

标签: 语料库分析

过滤结果
  • TextGrid_CC_BY_3_0授权_XML格式语料库数据

    2026年1月28日 30 130 74

    数据集概述 本数据集为XML格式的文本语料库压缩包,所有文本源自TextGrid平台,由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权,相关研究在《席勒-克莱斯特不确定性原理》中被提及,可用于计算机语言学或文本分析相关研究。 文件详解 文件名称:XML.zip 文件格式:ZIP(压缩包)...
    packageimg
  • FOR2828_TP2_Based_英语文学诗篇集分析结果数据

    2026年2月8日 30 33 21

    数据集概述 本数据集为FOR 2828研究单元“文本中的去神圣化与神圣化”框架下,TP2项目“英语文学中灵感、授权与神圣化的构型”对诗篇集语料库的分析结果,包含分析结果表格与说明文档,共2个文件。 文件详解 readme.txt 文件格式:TXT 字段映射介绍:说明数据集背景,包括所属研究单元、项目名称及分析内容概述。 TABLE Results P2...
    packageimg
  • BMSatire_Based语料库语言学分析数据_附文档

    2026年1月30日 30 142 138

    数据集概述 本数据集包含BMSatire Descriptions语料库的分析数据及相关文档,属于英国学术院资助项目“Curatorial Voice: legacy descriptions of art objects and their contemporary uses”的成果。语料库源自M. Dorothy...
    packageimg
  • DIALLS语料库的主要和次要分析报告_修订版

    2026年2月1日 30 94 3

    数据集概述 本数据集为DIALLS语料库的主次分析修订结果,包含一份处理后的Excel文件。数据涉及NLP文本语料库分析,可能关联医疗CT相关内容,无训练测试、数据标签或原始处理的拆分,专注于语料库的标准化分析呈现。 文件详解 文件名称:CORPUS LIGHT CODED_correct.xlsx 文件格式:XLSX...
    packageimg
  • 梵蒂冈教皇文件的语料库语言学分析_1967年至2020年

    2026年1月30日 30 90 79

    数据集概述 本数据集是对1967至2020年梵蒂冈教宗通谕、宗座劝谕和世界传播日致辞的语料库语言学分析结果。包含两个阶段:先是通过软件识别量化大众媒体与新媒体技术相关术语,后深入研究“媒体”术语的演变,包括相关动词的筛选、分类及伦理特征分析。 文件详解 文件名称:Papal Communication - WCD Messages - Media-...
    packageimg
  • KOnPoTe_Resources_船只与餐厅语义资源数据

    2026年1月30日 30 22 12

    数据集概述 本数据集包含KOnPoTe项目下与船只和餐厅相关的语义资源数据,涵盖本体结果、黄金标准、本体输入文件及语料库文件,共8个文件,主要用于自然语言处理领域的语义分析与本体构建相关研究。 文件详解 OWL文件(6个)...
    packageimg
  • Webis_SMC_12_用户搜索任务标注语料库_2012版

    2026年1月29日 30 59 17

    数据集概述 本数据集为Webis Search Mission Corpus 2012(Webis-SMC-12),包含127名用户的8840次搜索引擎交互记录。由两名人工标注员将交互划分为2881个逻辑会话和1378个任务,初始分歧通过讨论达成共识。数据集仅含1个压缩文件,无目录结构。 文件详解 文件名称:corpus-webis-...
    packageimg
  • d_RoRo_Based_德国浪漫主义小说标注语料库_完整版

    2026年1月29日 30 119 46

    数据集概述 本数据集为d-Romane-...
    packageimg
  • ElarArchive_dk0071_Dalabon语言占位词使用偏好数据

    2026年1月21日 30 194 165

    数据集概述 本数据集来自Ponsonnet的Dalabon语料库,记录了澳大利亚Gunwinyguan语系Dalabon语言中占位词keninjhbi及其变体的使用实例,用于研究该语言中占位词使用的个体偏好特征,包含2个数据文件。 文件详解 文件名称:Ponsonnet data set 2401026.ods 文件格式:ODS...
    packageimg
  • Hindawi_Based_19_20世纪阿拉伯文学计量风格测试语料库_数据集

    2026年1月20日 30 78 45

    数据集概述 本数据集包含19世纪至20世纪初的三类阿拉伯文学文本语料库,用于计量风格测试。涵盖Jurji Zaydan的22部编年历史小说、8位作者的65部作品、28位作者的300部作品。文本经标准化处理,适配R stylo工具,原始来源为Hindawi平台,压缩包内为UTF8编码的清洁文本文件。 文件详解 主文件...
    packageimg
  • Dataset_CORPUS_FINAL_PCI_巴西信息科学虚假信息研究数据集

    2026年1月19日 30 146 2

    数据集概述 本数据集是论文《巴西信息科学领域的虚假信息研究能告诉我们什么?》的配套数据,包含一个核心文件,主要内容为虚假信息研究相关的语料库数据,适用于信息科学领域的虚假信息主题分析。 文件详解 文件名称:dataset_CORPUS_FINAL_PCI.xlsx 文件格式:XLSX...
    packageimg
  • Neologism_Based_早期英语信件新词使用与用户研究数据_论文相关数据集

    2026年1月15日 30 73 51

    数据集概述 本数据集为论文“From plenipotentiary to puddingless: Users and uses of new words in early English...
    packageimg
  • 基于语料库的行为特征分析_古希腊形容词_mikrós_和_mégas_语义关系研究_补充材料

    2026年1月12日 30 103 31

    数据集概述 本数据集为论文“A corpus-based behavioral profile analysis of polysemy and antonymy: The case of the ancient Greek size adjectives mikrós and...
    packageimg
  • 开放科学与学术图书馆数字化转型颠覆性潜力研究数据集2022

    2025年12月23日 30 193 163

    数据集概述 本数据集为2022年硕士论文研究数据,围绕德累斯顿萨克森州立与大学图书馆的开放科学实践展开,包含基于语料库分析确定的访谈要素、 repertory grid技术访谈材料及interpretive clustering方法分析结果,支撑数字化转型颠覆性潜力研究。 文件详解 访谈材料类...
    packageimg
  • AntConc聚类工具生成文件集合

    2025年12月22日 30 159 19

    数据集概述 本数据集为使用AntConc聚类工具生成的文件集合,包含文本、表格、图片及配置等多种格式文件,围绕不同主题词(如rights、german、ceremony等)的聚类结果展开,为文本聚类分析提供直接数据支持。 文件详解 文件总数:25个,均为根目录下的独立文件 文件类型分布:...
    packageimg
  • 英语形容词排序灵活性探索数据集

    2025年12月15日 30 133 128

    数据集概述 本数据集聚焦英语形容词排序的灵活性,从认知、语用和文体学视角展开探索。包含一篇PDF格式的研究文档,为相关语言学研究提供理论分析和实证探讨的资料支持。 文件详解 文件名称: Dusmatov Khikmatullo Khayitbaevich.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 英语历史中并列与从属结构复制及补充材料数据集

    2025年12月13日 30 112 52

    数据集概述 本数据集是George Walkden研究《英语历史中并列与从属结构》的复制及补充材料,包含CSV格式的分析数据、查询脚本、图表PDF及说明文档,支持相关研究的复现与扩展分析。 文件详解 数据文件(CSV格式,64个): 示例文件:csv_subtypes_PPCME2_frl.csv、csv_data-...
    packageimg
  • 俄语谓语语法统计与作者实验研究报告

    2025年12月10日 30 91 62

    数据集概述 本数据集为2019年1月于莫斯科国立大学举办的维诺格拉多夫纪念讲座扩展内容,聚焦俄语与格谓语结构的语法特征、语料库统计及作者实验性用法分析,探讨经典语法约束的稳定性。 文件详解 文件名称:58212874 (1).pdf 文件格式:PDF (.pdf)...
    packageimg
  • OpenChart_SE瑞典人工电子健康记录语料库版本1

    2025年12月7日 30 208 79

    数据集概述 该数据集为OpenChart-SE语料库版本1,包含五十份由瑞典医师和医学生撰写的人工电子健康记录(EHR),模拟瑞典急诊科真实病历风格,经专业医师审核,用于推动瑞典语临床自然语言处理工具开发。 文件详解 人工病历文件(共五十个): 文件名称:以数字命名的txt文件(如5.txt、11.txt等) 文件格式:TXT(.txt)...
    packageimg
  • AntConc搭配分析结果文件集

    2025年12月4日 30 142 21

    数据集概述 该数据集包含通过AntConc搭配工具生成的21个文件,涵盖文本文档、图片、表格及配置文件等类型,核心记录不同关键词(如jap、deport、edu等)的搭配分析结果,为语言搭配研究提供数据支持。 文件详解 该数据集包含21个文件,具体说明如下: - 文本文档文件(.txt,共12个): -...
    packageimg