Reservierungen mit Vertex AI Workbench-Instanzen verwenden

Um sicherzustellen, dass VM-Ressourcen verfügbar sind, wenn Ihre Vertex Ai Workbench-Instanzen sie benötigen, können Sie Compute Engine-Reservierungen verwenden. Reservierungen bieten ein hohes Maß an Sicherheit beim Beschaffen von Kapazitäten für zonale Ressourcen von Compute Engine.

Beschränkungen und Anforderungen

Alle Einschränkungen von Compute Engine-Reservierungen gelten, wenn Vertex AI Workbench-Instanzen Reservierungen aufnehmen. Siehe Funktionsweise von Reservierungen.

Wenn Sie Reservierungen mit Vertex AI Workbench-Instanzen verwenden, gelten außerdem die folgenden Einschränkungen und Anforderungen:

  • Reservierungen für Vertex AI Workbench-Instanzen befinden sich in der privaten Vorschau. Informationen zum Anfordern des Zugriffs finden Sie auf der Seite Zugriffsanforderung.

  • Rabatte für zugesicherte Nutzung gelten nicht.

  • Die Verwendung von Reservierungen mit Vertex AI Workbench ist nur über die Notebooks API verfügbar. Die Verwendung von Reservierungen mit Vertex AI Workbench über die Google Cloud Console wird nicht unterstützt.

Hinweise

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Compute Engine and Notebooks APIs aktivieren.

    Aktivieren Sie die APIs

  4. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  5. Compute Engine and Notebooks APIs aktivieren.

    Aktivieren Sie die APIs

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihrem Nutzerkonto die folgenden IAM-Rollen für das Projekt zuzuweisen, damit Ihr Nutzerkonto die erforderlichen Berechtigungen zur Verwendung von Reservierungen mit Vertex AI Workbench-Instanzen hat:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Ihr Administrator kann Ihrem Nutzerkonto möglicherweise auch die erforderlichen Berechtigungen über benutzerdefinierte Rollen oder andere vordefinierte Rollen erteilen.

Reservierung erstellen

  1. Erstellen Sie eine Compute Engine-Reservierung. Es kann sich um eine Reservierung für ein einzelnes Projekt oder eine freigegebene Reservierung handeln. Weitere Informationen finden Sie in folgenden Dokumenten:

    Die Reservierung kann GPU-Beschleuniger enthalten.

Reservierung mit einer vorhandenen Instanz verwenden

Sie können Ihre Reservierung mithilfe der REST API einer Vertex AI Workbench-Instanz hinzufügen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Projekt-ID.
  • LOCATION: Zone, in der sich Ihre Instanz befindet.
  • INSTANCE_NAME: durch den Namen der Instanz
  • MACHINE_TYPE: den Maschinentyp Ihrer Instanz
  • RESERVATION_TYPE: den Reservierungstyp
  • RESERVATION_NAME: den Namen Ihrer Reservierung

HTTP-Methode und URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

JSON-Text der Anfrage:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Bei erfolgreicher Ausführung enthält der Antworttext eine Operation-Instanz.

Nutzung Ihrer Reservierung beenden

Wenn Sie Ihre Reservierung nicht mehr verwenden möchten, können Sie Ihre Reservierung löschen.

Wenn Sie Ihre Reservierung weiterhin mit anderen Ressourcen verwenden möchten, sie aber nicht von Ihrer vorhandenen Vertex AI Workbench-Instanz verwendet werden soll, müssen Sie die Instanz löschen.

Abrechnung

Reservierte Compute Engine-VM-Ressourcen werden von Vertex AI Workbench in Rechnung gestellt, solange die Vertex AI Workbench-Instanz ausgeführt wird. Compute Engine wird abgerechnet, wenn die VM-Ressourcen nicht von Vertex AI Workbench verwendet werden.

Nächste Schritte