使用 Vertex AI Pipelines 运行流水线时,使用 Vertex ML Metadata 存储流水线运行的工件和参数。通过 Vertex ML Metadata,您可以降低跟踪流水线元数据的难度来轻松分析流水线工件的沿袭。
工件的沿袭包括促使其创建的所有因素,以及从此工件派生的工件和元数据。例如,模型的沿袭可包括以下各项:
- 用于创建模型的训练、测试和评估数据。
- 模型训练期间使用的超参数。
- 在训练和评估过程中记录的元数据,例如模型的准确率。
- 源自该模型的工件,例如批量预测的结果。
您可以使用此元数据来帮助回答诸如以下问题:
- 为什么某些流水线运行会产生特别准确的模型?
- 哪次流水线运行产生的模型最准确,以及使用了哪些超参数来训练模型?
- 根据流水线中的步骤,您或许可以使用 Vertex ML 元数据来回答系统治理问题。例如,您可以使用元数据来确定在给定时间点生产环境中的模型的版本。
如果您不熟悉 Vertex ML Metadata,请阅读 Vertex ML Metadata 简介。
使用 Google Cloud 控制台分析流水线工件的沿袭
使用以下说明在 Google Cloud 控制台中查看流水线工件的沿袭图表。
在 Google Cloud 控制台的 Vertex AI 部分中,前往元数据页面。
“元数据”页面列出了已在默认元数据存储区中创建的工件。
在区域下拉列表中,选择在其中创建运行的区域。
点击工件的显示名称可查看其沿袭图表。
系统会显示一个静态图标,其中显示属于此沿袭图表的工件和作业。
点击相应的工件或执行作业可了解详情。
后续步骤
- 了解如何运行流水线。
- 开始直观呈现和分析流水线结果。
- 了解如何构建机器学习流水线。