巴西中学生葡萄牙语叙事作文自动评分数据集1963-2021
数据来源:互联网公开数据
标签:葡萄牙语,叙事作文,自动评分,教育评估,文本分析,中学生作文,巴西基础教育
数据概述:
本数据集收录了巴西公立学校5至9年级学生撰写的1235篇叙事作文,这些作文是基于指定的激励性文本撰写的。每篇作文都经过手动数字化和匿名处理。两组人工评估者根据预定义的评分标准对作文的不同方面进行了评估,评分标准涵盖了四个核心竞争力:正式语言使用、主题连贯性、叙事修辞结构和连贯性。每个维度的评分范围为1到5分,分数越高表示作文质量越好,语言能力越强。
数据用途概述:
该数据集适用于自动作文评分系统的开发和评估,特别是针对巴西基础教育体系中学生用葡萄牙语撰写的叙事作文。通过使用此数据集,研究人员可以训练和测试自动评分模型,以提高评分的一致性和效率。教育工作者可以利用这些模型提供更有效的形成性反馈,帮助学生提升写作技能。此外,该数据集还可以用于自然语言处理和文本分析领域的研究。
举例:
数据集中包含的每一行数据代表一篇学生作文及其相关信息。例如,一篇作文的记录可能如下所示:
id: 1
essay: [T]Minha Aventura[T]Há alguns anos, decidi mudar minha vida...[P]Em vez de continuar em minha cidade natal...[S]
prompt: Escreva uma narrativa sobre uma experiência que mudou sua vida.
Formal Register: 4
Thematic Coherence: 3
Narrative Rhetorical Structure: 4
Cohesion: 3
在这条记录中,id字段是作文的唯一标识符,essay字段包含作文的数字化文本,prompt字段提供了作文的背景信息,而四个评分字段则分别表示作文在不同维度上的得分。