Ray-Cluster in Vertex AI erstellen

Sie können einen Ray-Cluster auf Vertex AI mit der Console oder dem Vertex AI SDK für Python erstellen.

Lesen Sie zuerst die Ray in Vertex AI-Übersicht und richten Sie alle erforderlichen Tools ein.

Console

  1. Rufen Sie in der Google Cloud Console die Seite „Ray in Vertex AI“ auf.

    Zur Seite „Ray on Vertex AI“

  2. Klicken Sie auf Cluster erstellen, um den Bereich Cluster erstellen zu öffnen.

  3. Prüfen oder ersetzen Sie für jeden Schritt im Bereich Cluster erstellen die Standardclusterinformationen. Klicken Sie auf Weiter, um die einzelnen Schritte abzuschließen:

    1. Geben Sie unter Name und Region einen Namen an und wählen Sie eine Region für den Cluster aus.

    2. Geben Sie für Compute-Einstellungen die Konfiguration des Hauptknotens des Ray-Clusters in Vertex AI, einschließlich Maschinentyp, Beschleunigertyp und Anzahl, Laufwerkstyp und -größe und Replikatanzahl an. Unter Erweiterte Optionen können Sie den Verschlüsselungsschlüssel angeben.

    3. Geben Sie unter Netzwerk das VPC-Peering-Netzwerk an, das Sie mit Ray in Vertex AI verwenden möchten.

      Wenn Sie noch keine Verbindung für den Zugriff auf private Dienste für Ihr VPC-Netzwerk eingerichtet haben, klicken Sie auf Verbindung einrichten. Führen Sie im Feld Erstellen einer Verbindung für den Zugriff auf private Dienste die folgenden Schritte aus und klicken Sie auf Weiter:

      1. Aktivieren Sie die Service Networking API.

      2. Unter IP-Bereich zuweisen können Sie einen IP-Bereich auswählen, erstellen oder zulassen, dass Google automatisch einen IP-Bereich zuweist.

      3. Prüfen Sie unter Verbindung erstellen die Informationen Netzwerk und Zugewiesener IP-Bereich.

      4. Klicken Sie auf Verbindung erstellen.

  4. Klicken Sie auf Erstellen.

Ray on Vertex AI SDK

Verwenden Sie in einer interaktiven Python-Umgebung im VPC-Netzwerk Folgendes, um den Ray-Cluster in Vertex AI zu erstellen:

import ray
import vertex_ray
from google.cloud import aiplatform
from vertex_ray import Resources

# Define a default CPU cluster, machine_type is n1-standard-8, 1 head node and 1 worker node
head_node_type = Resources()
worker_node_types = [Resources()]

# Or define a GPU cluster.
head_node_type = Resources(
  machine_type="n1-standard-8",
  node_count=1,
)

worker_node_types = [Resources(
  machine_type="n1-standard-8",
  node_count=2,  # Can be > 1
  accelerator_type="NVIDIA_TESLA_K80",
  accelerator_count=1,
)]

aiplatform.init()
# Initialize Vertex AI to retrieve projects for downstream operations.
# Create the Ray cluster on Vertex AI
CLUSTER_RESOURCE_NAME = vertex_ray.create_ray_cluster(
  head_node_type=head_node_type,
  network=NETWORK,
  worker_node_types=worker_node_types,
  python_version="3.10",  # Optional
  ray_version="2.9",  # Optional
  cluster_name = CLUSTER_NAME
)

Wobei:

  • CLUSTER_NAME: Ein Name für den Ray-Cluster in Vertex AI, der in Ihrem Projekt eindeutig sein muss.

  • NETWORK ist der vollständige Name des Peering-VPC-Netzwerks im Format projects/PROJECT_NUMBER/global/networks/VPC_NAME.

  • PROJECT_NUMBER ist die Nummer Ihres Google Cloud-Projekts.

Sie sollten die folgende Ausgabe sehen, bis sich der Status in RUNNING ändert:

[Ray on Vertex AI]: Cluster State = State.PROVISIONING
Waiting for cluster provisioning; attempt 1; sleeping for 0:02:30 seconds
...
[Ray on Vertex AI]: Cluster State = State.RUNNING

Bitte beachten Sie dabei Folgendes:

  • Der erste Knoten wird als Hauptknoten verwendet.

  • TPU-Maschinentypen werden nicht unterstützt.

Nächste Schritte