Einrichtung für Ray in Vertex AI

Bevor Sie mit Ray on Vertex AI beginnen, führen Sie die Schritte zum Einrichten Ihres Google-Projekts, des Vertex AI SDK für Python und des VPC-Peering-Netzwerks aus:

  1. Führen Sie die Schritte unter Projekt und Entwicklungsumgebung einrichten aus, um die Abrechnung für Ihr Projekt einzurichten, die Vertex AI API zu aktivieren und die gcloud CLI zu installieren.

  2. Aktivieren Sie die Compute Engine API und die Service Networking API, falls noch nicht geschehen :

    APIs aktivieren

  3. Voraussetzung: Sie sollten wissen, wie Programme mit Open-Source-Ray entwickelt werden.

  4. Richten Sie ein VPC-Peering-Netzwerk und eine Verbindung für private Dienste für den Zugriff auf Vertex AI ein. Um mit dem Vertex AI SDK für Python eine Verbindung zum Ray-Hauptknoten auf dem Ray-Cluster in Vertex AI herzustellen, muss die verbindende Umgebung (z. B. Compute Engine VM oder Vertex AI Workbench-Notebook) sich im selben Peering-VPC-Netzwerk befinden.

    • Wenn Sie Ray on Vertex AI in der Google Cloud Console verwenden, können Sie Ihre Verbindung für den Zugriff auf private Dienste einrichten, während Sie den Ray-Cluster in Vertex AI erstellen.

    • Die beste Einrichtung für Ray on Vertex AI ist ein VPC-Netzwerk im automatischen Modus pro Projekt. Wenn Sie ein VPC-Netzwerk im benutzerdefinierten Modus oder mehrere VPC-Netzwerke verwenden, um Cluster im selben Projekt zu erstellen, können Probleme auftreten.

  5. Das hier verwendete Vertex AI SDK für Python ist eine Version des Vertex AI SDK für Python, die die Funktionen von Ray Client, Ray BigQuery Connector und Ray Serve on Vertex AI und Ray-Clusterverwaltung in Vertex AI umfasst.

    • Wenn Sie Ray on Vertex AI in der Google Cloud Console verwenden, führt Sie ein Colab Enterprise-Notebook durch den Installationsprozess von Vertex AI SDK für Python, nachdem Sie einen Ray-Cluster auf Vertex KI erstellt haben:

    • Wenn Sie Ray on Vertex AI in der Vertex AI Workbench oder einer anderen interaktiven Python-Umgebung verwenden, installieren Sie das Vertex AI SDK für Python:

      # The latest image in the Ray cluster includes Ray 2.9
      # The latest supported Python version is Python 3.10.
      $ pip install google-cloud-aiplatform[ray]

      Starten Sie nach der Installation des SDK den Kernel neu, bevor Sie Pakete importieren.

  6. Die maximale Anzahl von Knoten im Ray on Vertex AI-Cluster, auf die Sie hochskalieren können (M), hängt von der ursprünglichen Gesamtzahl der Knoten ab, die Sie eingerichtet haben (N). Nachdem Sie den Ray on Vertex AI-Cluster erstellt haben, können Sie die Gesamtzahl der Knoten auf eine beliebige Menge zwischen P und M (einschließlich) skalieren, wobei P die Anzahl der Pools in Ihrem Cluster ist.

    Unter der Annahme f(x) = min(29, (32 - ceiling(log2(x))) werden von Ihnen die folgenden Formeln verwendet. Damit wird sichergestellt, dass Sie die maximale Anzahl von Knoten (M) nicht überschreiten:

    • f(2 * M) = f(2 * N)
    • f(64 * M) = f(64 * N)
    • f(max(32, 16 + M)) = f(max(32, 16 + N))
  7. (Optional) Wenn Sie aus BigQuery lesen möchten, müssen Sie ein neues BigQuery-Dataset erstellen oder ein vorhandenes Dataset verwenden.

Unterstützte Standorte

In der Tabelle Featureverfügbarkeit für benutzerdefiniertes Modelltraining werden die verfügbaren Standorte für Ray on Vertex AI aufgeführt.

Nächste Schritte