Usa le prenotazioni con le istanze Vertex AI Workbench
Per assicurarti che le risorse VM siano disponibili quando le tue istanze Vertex AI Workbench ne hanno bisogno, puoi utilizzare le prenotazioni di Compute Engine. Le prenotazioni forniscono un elevato livello di garanzia per l'ottenimento di capacità per le risorse di zona di Compute Engine.
Limitazioni e requisiti
Tutte le limitazioni delle prenotazioni di Compute Engine si applicano quando le istanze Vertex AI Workbench utilizzano le prenotazioni. Vedi Come funzionano le prenotazioni.
Inoltre, quando utilizzi le prenotazioni con le istanze di Vertex AI Workbench, si applicano le seguenti limitazioni e requisiti:
Le prenotazioni per le istanze Vertex AI Workbench sono in anteprima privata. Per richiedere l'accesso, consulta la pagina della richiesta di accesso.
Gli sconti per impegno di utilizzo non sono applicabili.
L'uso delle prenotazioni con Vertex AI Workbench è disponibile solo tramite l'API Notebooks. L'uso delle prenotazioni con Vertex AI Workbench tramite la console Google Cloud non è supportato.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Abilita le API Compute Engine and Notebooks.
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Abilita le API Compute Engine and Notebooks.
Ruoli obbligatori
Per assicurarti che il tuo account utente disponga delle autorizzazioni necessarie per utilizzare le prenotazioni con le istanze di Vertex AI Workbench, chiedi all'amministratore di concedere al tuo account utente i seguenti ruoli IAM sul progetto:
-
Amministratore Compute (
roles/compute.admin
) -
Amministratore Notebooks (
roles/notebooks.admin
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.
L'amministratore potrebbe anche essere in grado di concedere al tuo account utente le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea una prenotazione
Creare una prenotazione Compute Engine. Può essere una prenotazione per un singolo progetto o una prenotazione condivisa. Per ulteriori informazioni, consulta i seguenti documenti:
La prenotazione può includere acceleratori GPU.
Utilizza la prenotazione con un'istanza esistente
Puoi aggiungere la prenotazione a un'istanza di Vertex AI Workbench utilizzando l'API REST.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
PROJECT_ID
: il tuo ID progettoLOCATION
: la zona in cui si trova l'istanzaINSTANCE_NAME
: il nome dell'istanzaMACHINE_TYPE
: il tipo di macchina dell'istanzaRESERVATION_TYPE
: il tipo di prenotazioneRESERVATION_NAME
: il nome della prenotazione
Metodo HTTP e URL:
POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON della richiesta:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Per inviare la richiesta, scegli una delle seguenti opzioni:
arricciatura
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Interrompere l'utilizzo della prenotazione
Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.
Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che l'istanza Vertex AI Workbench esistente la utilizzi, devi eliminare l'istanza.
Fatturazione
Le risorse VM di Compute Engine riservate vengono fatturate da Vertex AI Workbench mentre l'istanza di Vertex AI Workbench è in esecuzione e da Compute Engine quando le risorse VM non sono utilizzate da Vertex AI Workbench.
Passaggi successivi
- Per saperne di più sulle prenotazioni di Compute Engine, consulta Prenotazioni delle risorse di zona di Compute Engine.