Herkunft von Pipeline-Artefakten verfolgen

Jede mit Vertex AI Pipelines erstellte Pipeline-Ausführung umfasst mehrere zugehörige Artefakte und Parameter, z. B. Modelle, Datasets, Pipeline-Vorlagen und Komponenten. Die Herkunft eines Pipeline-Artefakts umfasst die Faktoren, die zu seiner Erstellung beigetragen haben, sowie Artefakte und Metadaten, die vom Artefakt abgeleitet wurden. Die Abstammung eines Modells kann zum Beispiel Folgendes enthalten:

Die Trainings-, Test- und Evaluationsdaten, die zum Erstellen des Modells verwendet wurden.
Die Hyperparameter, die während des Modelltrainings verwendet werden.
Metadaten, die aus dem Trainings- und Bewertungsprozess aufgezeichnet wurden, z. B. die Genauigkeit des Modells.
Artefakte, die von diesem Modell abstammen, z. B. die Ergebnisse von Batchvorhersagen.

Sie können mit diesen Metadaten die folgenden Fragen beantworten:

Warum hat ein bestimmter Pipeline-Ausführung ein besonders genaues Modell erzeugt?
Welche Pipelineausführung hat das genaueste Modell generiert und welche Hyperparameter wurden zum Trainieren des Modells verwendet?
Abhängig von den Schritten in Ihrer Pipeline können Sie möglicherweise System-Governance-Fragen beantworten. Mit Metadaten können Sie beispielsweise feststellen, welche Version Ihres Modells zu einem bestimmten Zeitpunkt in der Produktion war.

Zum Aufrufen und Analysieren der Herkunft des Pipeline-Artefakts können Sie entweder Vertex ML Metadata oder Dataplex verwenden.

In der folgenden Tabelle werden die Unterschiede zwischen Vertex ML Metadata und Dataplex beschrieben:

Funktion	Vertex ML Metadata	Dataplex
Arten von erfassten Pipeline-Metadaten	Alle Eingabe- und Ausgabeartefakte, die von einer Pipelineausführung erzeugt werden.	Eingabe- und Ausgabeartefakte, die vollständig qualifizierten Namen (FQNs) zugeordnet werden können, die von Dataplex unterstützt werden, in der Regel mithilfe von Google Cloud-Pipeline-Komponenten
Geografie	Lesevorgänge für einzelne Regionen.	Globale Lesevorgänge, also über mehrere Regionen hinweg.
Projekte	Lesevorgänge für einzelne Projekte	Organisationsweite Lesevorgänge in mehreren Projekten.
Integrierte Dienste	Eingebunden in Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry und Datasets	In mehrere Google Cloud-Produkte wie Vertex AI, BigQuery, Cloud Composer und Dataproc eingebunden.
Aktivieren?	Nein, immer an.	Für jeden ML-Metadatenspeicher ist eine Aktivierung erforderlich.

Vertex ML-Metadatenartefakte Dataplex zuordnen

So ordnen Sie Vertex ML-Metadatenartefakte den FQNs in Dataplex zu:

Verwenden Sie Google Cloud-Pipeline-Komponenten beim Erstellen von Vertex AI-Modellen und verwalteten Datasets.
Verwenden Sie benutzerdefinierte Schematitel (google.VertexDataset oder google.VertexModel), wenn Sie den Ressourcennamen des Modells oder des verwalteten Datasets im Feld metadata angeben, wie im folgenden Beispiel dargestellt:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "http://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Herkunft von Pipeline-Artefakten mit Vertex ML Metadata analysieren

Wenn Sie eine Pipeline mit Vertex AI Pipelines ausführen, werden die Artefakte und Parameter der Pipeline-Ausführung mithilfe von Vertex ML Metadata gespeichert. Vertex ML Metadata erleichtern die Analyse der Herkunft der Artefakte Ihrer Pipeline, da Sie auf diese Weise die Metadaten Ihrer Pipeline nicht verfolgen müssen.

Wenn Sie mit Vertex ML Metadata noch nicht vertraut sind, lesen Sie die Einführung in Vertex ML Metadata.

Folgen Sie dieser Anleitung, um das Herkunftsdiagramm für ein Pipeline-Artefakt mithilfe von Vertex ML Metadata aufzurufen:

Rufen Sie in der Google Cloud Console im Abschnitt „Vertex AI“ die Seite Metadaten auf.

Zur Seite "Metadaten"

Auf der Seite „Metadaten“ werden die Artefakte aufgeführt, die im Standard-Metadatenspeicher erstellt wurden.
Wählen Sie in der Drop-down-Liste Region die Region aus, in der Ihre Ausführung erstellt wurde.
Klicken Sie auf den Anzeigenamen eines Artefakts, um dessen Herkunftsdiagramm zu sehen.

Es wird eine statische Grafik mit den Artefakten und Ausführungen angezeigt, die Teil dieses Herkunftsdiagramms sind.
Klicken Sie auf ein Artefakt oder auf eine Ausführung, um mehr darüber zu erfahren.

Herkunft von Pipeline-Artefakten mit Dataplex analysieren

Dataplex Data Catalog erkennt Metadaten aus Google Cloud-Ressourcen, darunter Vertex AI Pipelines-Artefakte wie Vertex AI-Modelle, verwaltete Datasets und andere Google Cloud-Ressourcen, die in Data Catalog gefunden werden können. Sie können diese Artefakte mit der Metadatensuchfunktion von Data Catalog ermitteln und die zugehörigen Herkunftsdiagramme aufrufen.

Weitere Informationen zur Suchfunktion von Data Catalog für Metadaten finden Sie unter Datenassets mit Data Catalog suchen und ansehen.

So rufen Sie das Herkunftsdiagramm für ein Pipeline-Artefakt in Dataplex auf:

Rufen Sie zum Starten einer Dataplex-Suchabfrage in der Google Cloud Console die Seite Dataplex Search auf.

Dataplex Search aufrufen
Verwenden Sie die Filter, um nach den Artefakten zu suchen. Mit dem Filter Datentypen können Sie beispielsweise den Artefakttyp angeben, z. B. Modell, Dataset oder BigQuery-Tabelle. Weitere Informationen zur Data Catalog-Suche finden Sie unter Nach Datenassets suchen.

Sie können Ihre Abfrage auch im Suchfeld definieren.
Klicken Sie auf den Namen eines Artefakts und dann auf den Tab Herkunft, um die Herkunft eines Artefakts anzusehen.

Im Herkunftsdiagramm ist den Vertex AI-Prozessen vorangestellt. Dazu gehören Pipeline-Artefakte, Pipeline-Komponenten und Pipelinevorlagen.
- Klicken Sie auf den Prozess im Herkunftsdiagramm, um die Details zu einem Prozess aufzurufen.
  
  Hinweis: Die Prozessdetails sind nur verfügbar, wenn der Prozess in Dataplex mit einem voll qualifizierten Namen (FQN) katalogisiert wurde.
- Für Prozesse, die auf Pipelineaufgaben aus Pipelineausführungen basieren, können Sie so vorgehen:
  - Rufen Sie die Pipeline-Ausführung in Vertex AI auf. Klicken Sie dazu auf dem Tab Details auf In Vertex AI öffnen. Klicken Sie auf Mehr, um die Laufzeitdetails einer Pipelineausführung wie Status, Zeitstempel und Attribute aufzurufen. Klicken Sie zum Aufrufen der Pipelineausführung in Vertex AI auf In Vertex AI öffnen.
- Für Prozesse, die auf einer Pipelinevorlage basieren, können Sie Folgendes tun:
  - Rufen Sie die Vorlagendetails in Vertex AI auf. Klicken Sie dazu auf dem Tab Details auf In Vertex AI öffnen.
  - Rufen Sie die Liste der Pipelineaufgaben, die in Pipelineausführungen erstellt wurden, auf dem Tab Ausführungen auf. Um die Details der Pipelinevorlage in Vertex AI aufzurufen, klicken Sie auf Mehr und dann auf In Vertex AI öffnen.

Nächste Schritte

Pipeline ausführen.
Erste Schritte mit der Visualisierung und Analyse der Pipelineergebnisse.
Pipeline für maschinelles Lernen erstellen