数据集概述
本数据集是论文“Architectural Design Decisions for the Machine Learning Workflow”的配套数据与代码 artifact,包含机器学习工作流架构设计决策模型的生成结果、生成工具、元模型定义、源编码、模型实现及研究方法附录,用于支持机器学习工程领域的架构决策研究与实践。
文件详解
- 文件名称:ml_workflow_adds_v1.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含多个目录,核心内容包括:
- _generated:生成的结果文件,含可用于出版物的LaTeX表格、架构设计决策模型的文本与图形形式
- Generators:用于生成上述结果的Python应用程序
- Metamodels:含类型定义的Python文件
- Sources_coding:源编码及审计追踪文件
- Add_models:模型与源编码的Python实现
- appendix:研究方法的详细描述文档
数据来源
论文“Architectural Design Decisions for the Machine Learning Workflow: Dataset and Code”
适用场景
- 机器学习工作流架构研究:分析从业者在机器学习生产化过程中面临的架构决策挑战与实践模式
- 软件工程与机器学习融合研究:基于扎根理论方法探究软件架构与机器学习实践的差异与协同路径
- 架构决策模型应用:利用数据集的模型成果,为机器学习工程师提供设计决策指导与风险降低支持
- 自动化设计工具开发:基于Generators目录的Python程序,拓展机器学习工作流架构决策的自动化辅助工具
- 研究方法复现:通过appendix的研究方法描述,复现或优化基于灰色文献的定性研究流程