数据集

学生英语写作质量评估数据集

学生英语写作质量评估数据集_Student_English_Writing_Quality_Assessment

数据来源：互联网公开数据

标签：写作评估, 文本分析, 语言模型, 英语教育, 自然语言处理, 文本特征, 机器学习, 质量评价

数据概述：该数据集包含学生英语写作文本及其对应的评估结果，旨在用于训练和评估英语写作质量评估模型。主要特征如下：时间跨度：数据未明确标注时间，可视为静态文本集合。地理范围：数据来源未明确，但文本内容为通用英语，适用于全球英语学习者。数据维度：包括“text_id”（文本唯一标识符）、“full_text”（完整写作文本）以及针对“cohesion”（连贯性）、“syntax”（句法）、“vocabulary”（词汇）、“phraseology”（用语）、“grammar”（语法）和“conventions”（规范）的评估分数。此外，还包含“fold”（交叉验证折数）、“text_length”（文本长度）和预测的各项评估分数（pred_cohesion, pred_syntax, pred_vocabulary, pred_phraseology, pred_grammar, pred_conventions）。数据格式：主要数据以CSV格式提供（oof_df.csv），包含结构化文本和评估分数。此外，还包含tokenizer相关的JSON文件，用于文本预处理。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、教育科技、写作评估等领域的学术研究，例如，探索不同写作维度之间的相互关系，开发更精准的自动评估模型。行业应用：可以为教育科技公司和在线英语学习平台提供数据支持，用于开发自动写作评分系统、个性化学习反馈工具等。决策支持：支持教育机构和教师对学生写作水平进行评估，并为学生提供针对性的改进建议。教育和培训：作为英语写作教学课程的辅助材料，帮助学生了解写作评价标准，提升写作能力。此数据集特别适合用于开发和优化自动英语写作评估模型，并深入研究英语写作的各个组成部分，从而帮助学生提升写作水平，并为教育工作者提供有效的评估工具。

数据与资源

学生英语写作质量评估数据集_Student_English_Writing_Quality_A...ZIP
563.72 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	563.72 MiB
最后更新	2025年7月9日
创建于	2025年7月9日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

学生英语写作质量评估数据集

数据与资源

附加信息

注册成功！