Open_Linguistics待发表文章补充材料与原始数据

数据集概述

本数据集包含发表于《Open Linguistics》的论文《COVID-19的语言影响:四种语言的语料库研究》的补充材料(A、B、C)及原始数据,涵盖病毒名称及相关词汇的多语言原始数据,为研究提供支撑。

文件详解

  • 补充材料文件:
  • Supplement A.pdf、Covid discourse Supplement A.docx:论文补充材料A的PDF及Word版本
  • Supplement B.pdf、Covid discourse Supplement B.docx:论文补充材料B的PDF及Word版本
  • Supplement C.pdf、Covid discourse Supplement C.docx:论文补充材料C的PDF及Word版本
  • 原始数据压缩包:
  • raw_data_virus_names.tar.gz:病毒名称原始数据压缩包,含所有语言合并文件及单语言文件
  • raw_data_virus_associated_words.tar.gz:病毒相关词汇原始数据压缩包,含所有语言合并文件及单语言文件

适用场景

  • 语言学研究:分析COVID-19相关话语在不同语言中的词汇使用特征
  • 语料库语言学:基于多语言病毒名称及关联词汇数据开展对比研究
  • 疫情话语分析:探究疫情背景下语言表达的演变规律
  • 自然语言处理:利用原始词汇数据训练或验证相关NLP模型
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 85.71 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。