基于文档_词汇组合图的维基百科搜索数据集

数据集概述

本数据集是信息学专业学士学位论文的配套数据,围绕“文档-词汇组合图在维基百科搜索中的应用”展开,包含实验相关的多个压缩文件,为研究该搜索方法提供数据支持。

文件详解

该数据集包含6个压缩文件,均位于"Using Combined Document-Word Graphs for Wikipedia Search/"目录下,具体如下: - 文件名称: Depth First Search.zip,文件格式: ZIP - 文件名称: Crowdflower.zip,文件格式: ZIP - 文件名称: Evaluation.zip,文件格式: ZIP - 文件名称: Manual Ideal Ranking.zip,文件格式: ZIP - 文件名称: Final Queries.zip,文件格式: ZIP - 文件名称: Test Questions.zip,文件格式: ZIP

适用场景

  • 信息检索研究: 分析文档-词汇组合图方法在维基百科搜索任务中的效果
  • 自然语言处理应用: 探索文本结构(文档、词汇)对搜索结果的影响
  • 搜索引擎优化: 研究深度优先搜索等算法在特定搜索场景中的性能
  • 学术论文复现: 支持基于该学士学位论文的实验结果验证与方法改进
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 19.87 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。