Usa le prenotazioni con le istanze Vertex AI Workbench

Per assicurarti che le risorse VM siano disponibili quando le tue istanze Vertex AI Workbench ne hanno bisogno, puoi utilizzare le prenotazioni di Compute Engine. Le prenotazioni forniscono un elevato livello di garanzia per l'ottenimento di capacità per le risorse di zona di Compute Engine.

Limitazioni e requisiti

Tutte le limitazioni delle prenotazioni di Compute Engine si applicano quando le istanze Vertex AI Workbench utilizzano le prenotazioni. Vedi Come funzionano le prenotazioni.

Inoltre, quando utilizzi le prenotazioni con le istanze di Vertex AI Workbench, si applicano le seguenti limitazioni e requisiti:

  • Le prenotazioni per le istanze Vertex AI Workbench sono in anteprima privata. Per richiedere l'accesso, consulta la pagina della richiesta di accesso.

  • Gli sconti per impegno di utilizzo non sono applicabili.

  • L'uso delle prenotazioni con Vertex AI Workbench è disponibile solo tramite l'API Notebooks. L'uso delle prenotazioni con Vertex AI Workbench tramite la console Google Cloud non è supportato.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Abilita le API Compute Engine and Notebooks.

    Abilita le API

  4. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  5. Abilita le API Compute Engine and Notebooks.

    Abilita le API

Ruoli obbligatori

Per assicurarti che il tuo account utente disponga delle autorizzazioni necessarie per utilizzare le prenotazioni con le istanze di Vertex AI Workbench, chiedi all'amministratore di concedere al tuo account utente i seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.

L'amministratore potrebbe anche essere in grado di concedere al tuo account utente le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Crea una prenotazione

  1. Creare una prenotazione Compute Engine. Può essere una prenotazione per un singolo progetto o una prenotazione condivisa. Per ulteriori informazioni, consulta i seguenti documenti:

    La prenotazione può includere acceleratori GPU.

Utilizza la prenotazione con un'istanza esistente

Puoi aggiungere la prenotazione a un'istanza di Vertex AI Workbench utilizzando l'API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la zona in cui si trova l'istanza
  • INSTANCE_NAME: il nome dell'istanza
  • MACHINE_TYPE: il tipo di macchina dell'istanza
  • RESERVATION_TYPE: il tipo di prenotazione
  • RESERVATION_NAME: il nome della prenotazione

Metodo HTTP e URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON della richiesta:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Per inviare la richiesta, scegli una delle seguenti opzioni:

arricciatura

Salva il corpo della richiesta in un file denominato request.json ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
In caso di esito positivo, il corpo della risposta contiene un'istanza di Operation.

Interrompere l'utilizzo della prenotazione

Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.

Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che l'istanza Vertex AI Workbench esistente la utilizzi, devi eliminare l'istanza.

Fatturazione

Le risorse VM di Compute Engine riservate vengono fatturate da Vertex AI Workbench mentre l'istanza di Vertex AI Workbench è in esecuzione e da Compute Engine quando le risorse VM non sono utilizzate da Vertex AI Workbench.

Passaggi successivi