数据集

知识点关联预测数据集

知识点关联预测数据集_Knowledge_Point_Association_Prediction_Dataset

数据来源：互联网公开数据

标签：知识图谱, 关联预测, 文本匹配, 机器学习, 教育领域, 自然语言处理, 数据挖掘, 知识点分析

数据概述：该数据集包含用于知识点关联预测任务的数据，记录了课程内容、知识点之间的关系，以及模型预测结果。主要特征如下：时间跨度：数据未明确标注时间，可视为静态知识点关联信息。地理范围：数据未限定地理范围，适用于全球范围内的教育内容分析。数据维度：数据集核心为CSV文件（oof_df.csv），包含以下关键字段：id（唯一标识符），title（课程标题），description（课程描述），channel（频道），category（类别），level（难度等级），language（语言），parent（父级知识点），has_content（是否有内容），content_ids（内容ID），pred_ids（模型预测的关联知识点ID），pred_ids2（另一种模型预测的关联知识点ID），parent_title（父级知识点标题），parent_description（父级知识点描述），grand_parent（祖父级知识点），grand_parent_title（祖父级知识点标题），grand_parent_description（祖父级知识点描述），stratify_category（分层类别），fold（交叉验证折数），common_ids（共同ID），pred_id_num（预测ID数量），pred_content_ids（预测内容ID）。此外，数据集还包含用于模型训练的tokenizer配置信息，以JSON格式存储在tokenizer文件夹内。数据格式：主要数据以CSV格式存储，便于数据处理和分析。tokenizer相关配置以JSON格式存储，用于模型构建。数据来源于在线教育平台内容，经过预处理和标注。该数据集适合用于知识点关联预测、文本匹配、以及教育内容分析等领域。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于教育领域知识图谱构建、知识点关联分析、课程内容推荐等方面的学术研究，如知识图谱嵌入、关系抽取、多模态内容理解等。行业应用：为在线教育平台、智能学习系统提供数据支持，可用于优化课程推荐、构建个性化学习路径、提升学习效果评估等。决策支持：支持教育内容提供商进行内容优化、课程设计、以及学习资源管理。教育和培训：作为机器学习、自然语言处理等相关课程的实训数据，帮助学生和研究人员理解知识点关联预测模型，并进行实践操作。此数据集特别适合用于探索知识点之间的内在联系，提高推荐系统的准确性和个性化程度，优化教育资源的组织和呈现方式。

数据与资源

知识点关联预测数据集_Knowledge_Point_Association_Predicti...ZIP
778.21 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	778.21 MiB
最后更新	2025年8月4日
创建于	2025年8月4日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

知识点关联预测数据集

数据与资源

附加信息

注册成功！