-
MOOC课程视频讲稿嵌入与主题向量数据集
2025年11月27日 30 188 174
数据集概述 本数据集包含从Coursera平台收集的两千门课程、一万两千零三十二个视频讲稿生成的词嵌入和文档主题分布向量。通过Python的Gensim包实现Word2Vec和LDA技术,分别生成不同维度的词嵌入及主题向量,为MOOC内容的文本分析提供基础数据。 文件详解 该数据集由两个目录下的CSV文件组成,具体说明如下: - Word...
2025年11月27日 30 188 174