HESML与SML语义度量库可扩展性和性能基准数据集

数据集概述

本数据集提供HESML V1R2与SML 0.9等语义度量库的可扩展性和性能基准测试数据,包含可复现实验的Java程序、测试结果文件及相关分析脚本,支持复现Lastra-Díaz和García-Serrano的研究工作。

文件详解

数据集包含以下文件,位于同一目录下: - benchmarks_HESML_vs_SML.csv:CSV格式数据文件,包含分类大小、创建时间、AncDesLeaves时间等基准测试指标字段。 - final_results_SimLex665.csv:CSV格式数据文件,记录SML、WNetSS、HESML在SimLex665数据集上的多轮运行时间(毫秒)。 - HESML_vs_SML.pdf:PDF格式文档,可能为基准测试相关的说明或结果报告。 - IS_HESML_figure3_and_table18.r:R语言脚本文件,用于生成研究中的图3和表18。 - HESML_vs_SML_test.zip:压缩包文件,可能包含HESML_vs_SML_test.jar程序及相关依赖资源。

适用场景

  • 语义计算研究:对比不同语义度量库的性能与可扩展性差异。
  • 自然语言处理:评估语义相似性计算工具的效率表现。
  • 学术研究复现:复现Lastra-Díaz和García-Serrano关于HESML库的实验结果。
  • 算法性能优化:为语义度量算法的效率提升提供基准参考。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 41.47 MiB
最后更新 2025年11月30日
创建于 2025年11月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。