数据集概述
该数据集包含通过AntConc搭配工具生成的21个文件,涵盖文本文档、图片、表格及配置文件等类型,核心记录不同关键词(如jap、deport、edu等)的搭配分析结果,为语言搭配研究提供数据支持。
文件详解
该数据集包含21个文件,具体说明如下:
- 文本文档文件(.txt,共12个):
- 文件示例:jap_antconc_Collocate.txt、deport_antconc_Collocate.txt、brit_antconc_Collocate.txt等
- 字段示例:Collocate(搭配词)、Rank(排名)、Freq(Scaled)(缩放频率)、FreqLR(左右总频率)、FreqL(左侧频率)、FreqR(右侧频率)、Range(范围)、Likelihood(可能性)、Effect(效应)
- 图片文件(.png,共5个):
- 文件示例:Jap_Collocate_chart.png、edu_collocate chart.png、Women_collocate_Chart.png等
- 表格文件(.xlsx,共3个):
- 文件示例:jap_antconc_Collocate.xlsx、right_antconc_Collocate.xlsx、wom_antconc_Collocate.xlsx
- 配置文件(.ini,共1个):
- 文件示例:antconc_settings_collocate.ini
适用场景
- 计算语言学研究:分析特定关键词的搭配模式与频率特征
- 语言教学应用:探究目标词汇的典型搭配结构,辅助词汇教学
- 语料库语言学分析:通过搭配数据研究语言使用规律
- 自然语言处理:为搭配识别模型训练或验证提供基础数据