数据集概述
该数据集是ESWC'23会议论文《Refining Large Integrated Identity Graphs using the Unique Name Assumption》的配套资源,包含论文代码、数据及执行历史等相关文件,为复现论文研究提供支持。
文件详解
- 文件名称: Shuai_iUNA_ESWC_camera_ready (1).pdf
- 文件格式: PDF
- 内容说明: 可能是论文的最终版本(camera-ready)
- 文件名称: submit-ESWC-2023-FINAL.zip
- 文件格式: ZIP压缩包
- 内容说明: 压缩包内包含多个目录,具体如下:
- ./sources: 包含三种类型的数据源
- ./algorithm: 包含与算法对应的脚本文件
- ./gold_standard: 包含黄金标准数据及每个连通组件的附加信息(如边的误差程度),志愿者注释存储在*.tsv文件中
- ./other_scripts: 包含分析、数据提取/处理及绘图相关的脚本
- ./execution_history: 包含评估过程中的所有日志文件,摘要存储在*.log文件中
数据来源
Zenodo
适用场景
- 学术研究: 复现论文中关于大型集成身份图优化的研究方法与实验结果
- 算法开发: 参考和改进基于唯一名称假设(Unique Name Assumption)的身份图优化算法
- 语义网技术应用: 探索大型身份图在语义网领域的构建与优化实践
- 数据处理流程设计: 学习和借鉴身份图数据的提取、处理及评估的完整流程