数据集概述
本数据集围绕MDA框架下的语义数据生成流程展开,包含从数据需求到语义数据集及领域本体的全流程成果。涉及COVID-19、马德里地铁GTFS、西班牙访客等场景的本体文件、RDF数据集、DSL代码及规则文件,共15个文件,覆盖.txt、.owl、.rdf、.zip四种格式,支持语义数据生成方法的验证与应用。
文件详解
- 本体文件(.owl格式)
- 文件名称:ontology_v1.0_visitorsSpain.owl、ontology_v1.1_GTFS.owl、ontology_v1.2_GTFS.owl、ontology_v1.1_COVID-Ont.owl
- 文件格式:OWL
- 字段映射介绍:领域本体文件,包含COVID-19、马德里地铁GTFS、西班牙访客等场景的本体定义,用于语义数据的领域上下文建模
- 语义数据集文件(.rdf格式)
- 文件名称:dataset_GTFS_Metro_Madrid.rdf、dataset_COVID-19_Spain_first_wave.rdf、dataset_visitorsSpain.rdf
- 文件格式:RDF
- 字段映射介绍:基于本体生成的语义数据集,包含对应场景的结构化语义数据,支持领域内数据的统一与对齐
- 领域特定语言代码文件(.txt格式)
- 文件名称:DSLcode_COVID-19.txt、DSLcode_visitorsSpain.txt、DSLcode_GTFS.txt
- 文件格式:TXT
- 字段映射介绍:定义数据文件引用(如FILE(#Reports,reports.csv))、前缀(如PREFIX(gn,http://www.geonames.org/ontology#))等内容,用于驱动语义数据生成
- 规则与模板文件(.txt格式)
- 文件名称:templateOntology.txt、QVTrules.txt
- 文件格式:TXT
- 字段映射介绍:包含本体模板和QVT转换规则,用于指导从领域模型到本体的生成过程
- 压缩包文件(.zip格式)
- 文件名称:dasets_public_transport_agencies.zip、domainDataSourceFiles_visitorsSpain.zip
- 文件格式:ZIP
- 字段映射介绍:领域数据源压缩包,包含公共交通机构数据、西班牙访客领域数据源文件
适用场景
- MDA框架语义数据生成研究: 用于验证基于MDA框架的语义数据生成流程,分析从数据需求到语义数据集的转化效率与准确性
- 领域本体构建实践: 基于提供的OWL本体文件和模板,开展COVID-19、公共交通等特定领域的本体构建与优化
- 语义数据标准化应用: 利用RDF数据集和DSL代码,探索多源数据的语义统一与对齐方法,提升数据互操作性
- 领域特定语言(DSL)设计参考: 参考DSLcode文件的语法与结构,设计适用于不同领域的语义数据生成DSL
- 语义数据转换规则验证: 通过QVTrules.txt文件,验证模型驱动架构中QVT转换规则的有效性与可行性