JALCOS_CELEN_Based日语学习者西班牙语写作语料库_2023版

数据集概述

本数据集为日语学习者西班牙语语料库(JALCOS)1.2版,包含222名日语母语大学生(英语为第二语言、西班牙语为第三语言)2004年撰写的222篇西班牙语作文(约8.7万字)。作文基于7个主题(含议论文、记叙文),每条数据附作者背景、写作条件等元数据,遵循国际学习者语料库标准构建,用于西班牙语二语习得研究。

文件详解

  • 文件名称:Jalcos_readme_en.txt
  • 文件格式:TXT
  • 字段映射介绍:包含语料库简介、元数据说明(作者背景、写作主题、字数要求等16项元数据字段)、作文主题列表、数据局限性及使用许可等信息。
  • 文件名称:Jalcos_20230325_zenodo.xml
  • 文件格式:XML
  • 字段映射介绍:结构化存储作文文本及元数据,元数据字段包括作者编号、大学、年级、性别、母语、其他语言能力、是否去过西班牙语国家、作文编号、写作年份、主题、文本功能、字数要求、是否使用辅助工具、写作媒介等,文本含段落标记

数据来源

Aichi University教授Yoshihito Kamakura设计并收集,Kansai Gaidai University的Pilar Valverde处理数据,纳入CELEN语料库集合。

适用场景

  • 西班牙语二语习得研究: 分析日语母语者学习西班牙语的语言特征、错误类型及发展规律。
  • 写作主题与语篇功能研究: 对比议论文、记叙文等不同语篇类型的写作特点与学习者表现。
  • 学习者背景与写作能力关联分析: 探究年级、语言能力、是否使用辅助工具等因素对写作质量的影响。
  • 跨语言语料库对比研究: 与ICLE(英语学习者语料库)等国际语料库对比,分析不同母语背景学习者的二语写作共性与差异。
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年1月20日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。