视频级学生在线视频使用与学习分析数据集

数据集概述

本数据集包含STEM领域不同大学课程中,学生播放视频格式学习材料的学习分析数据,覆盖十年时间。数据涉及35个视频的40,453个会话、313,724条记录,还包含视频的带时间戳转录文本(含原文及英文翻译),可支持学习分析和教育数据挖掘相关研究与应用。

文件详解

  • 字幕文件(.srt)
  • 文件数量:36个(占比约43.9%)
  • 示例文件:distrarq.mp4.srt、nosqlmagregacar_es.srt、nosqlmagregamot_en.srt
  • 内容说明:视频的带时间戳转录文本,包含原始语言及英文翻译版本
  • 文本文件(.txt)
  • 文件数量:22个(占比约26.83%)
  • 示例文件:75585_02_es.txt、mongoCREA_en.txt、usoNeo4J_en.txt
  • 内容说明:视频相关的文本内容,如课程主题描述(如数据库逻辑设计相关文本)
  • 文档文件(.docx)
  • 文件数量:15个(占比约18.29%)
  • 示例文件:tflops_en.docx、mongoCREA_en.docx、mongroCREA_en.docx
  • 内容说明:视频配套的文档资料
  • 数据文件(.csv、.parquet、.sql)
  • CSV文件:2个(示例:dump.csv、dump_headers.csv),含学习行为记录字段(如id、initial_timestamp、video、action等)
  • Parquet文件:2个(示例:dump.parquet、dump_headers.parquet),存储学习分析结构化数据
  • SQL文件:1个(dump.sql),数据库备份格式的学习行为数据
  • 代码文件(.py、.r)
  • Python文件:1个(mysqldump_to_csv.py),数据格式转换脚本
  • R文件:1个(notes.r),数据分析相关笔记或脚本
  • 其他文件
  • RData文件:1个(dump.RData),R语言数据存储格式文件
  • Text文件:1个(estadistica4_ca.text),文本内容文件

适用场景

  • 学习行为分析:研究STEM学生观看学习视频时的操作行为(如seek动作)、学习会话特征与学习效果的关联
  • 教育数据挖掘工具测试:验证学习分析或教育数据挖掘工具在视频学习场景下的有效性
  • 教学决策支持:帮助教师基于学生视频学习行为数据优化教学内容或视频设计
  • 视频学习资源优化:分析视频转录文本与学生学习行为的关系,优化视频字幕或内容呈现形式
  • 跨语言学习资源研究:利用多语言转录文本,探究不同语言版本视频对学生学习的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 123.09 MiB
最后更新 2026年2月10日
创建于 2026年2月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。