RUNNING
o ERROR
.
Il riavvio di una risorsa permanente ti consente di recuperare gli errori da cui la risorsa permanente non può recuperare da sola. Puoi anche riavviare una risorsa permanente
per ottenere manualmente cluster più aggiornati. Questa pagina mostra come riavviare una risorsa permanente utilizzando la console Google Cloud e l'API REST.
Ruoli obbligatori
Per ottenere l'autorizzazione necessaria per il riavvio di una risorsa permanente,
chiedi all'amministratore di concederti il ruolo IAM
Amministratore Vertex AI (roles/aiplatform.admin
) per il tuo progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.
Questo ruolo predefinito contiene l'autorizzazione aiplatform.persistentResources.update
, necessaria per riavviare una risorsa permanente.
Potresti anche essere in grado di ottenere questa autorizzazione con i ruoli personalizzati o altri ruoli predefiniti.
Riavvia una risorsa permanente
Seleziona una delle seguenti schede per istruzioni su come riavviare una risorsa permanente. Assicurati che non siano in esecuzione job di addestramento nella risorsa permanente.
Console
Per riavviare una risorsa permanente nella console Google Cloud, segui questi passaggi:
Nella console Google Cloud, vai alla pagina Risorse permanenti.
Accanto al nome della risorsa permanente che vuoi riavviare, fai clic sui puntini di sospensione verticali (
).Fai clic su Riavvia.
Fai clic su Conferma.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: l'ID progetto della risorsa permanente che vuoi riavviare.
- LOCATION: la regione della risorsa permanente che vuoi riavviare.
- PERSISTENT_RESOURCE_ID: l'ID della risorsa permanente che vuoi riavviare.
Metodo HTTP e URL:
POST http://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
Il riavvio di una risorsa permanente è un'operazione a lunga esecuzione, durante la quale non è possibile eliminare la risorsa permanente. L'operazione contiene un campo progressMessage
che viene compilato con uno stato di errore, se si verifica. Dopo che l'operazione indica "done: true"
, controlla lo stato della risorsa permanente. Se la risorsa permanente è nello stato RUNNING
, il riavvio ha esito positivo ed è pronta per eseguire job di addestramento.
Limitazioni
Di seguito sono riportate le limitazioni per il riavvio di una risorsa permanente:
- In alcuni casi, è possibile perdere la capacità delle risorse scarse durante il riavvio di una risorsa permanente. La conservazione completa delle risorse non è garantita.
- Il riavvio non è disponibile su Ray su Vertex AI.
- Le risorse permanenti contenenti pool di worker con scalabilità automatica si riavviano con il numero minimo di repliche.
Passaggi successivi
- Scopri di più sulle risorse permanenti.
- Crea e utilizza una risorsa permanente.
- Esegui job di addestramento su una risorsa permanente.
- Recuperare informazioni su una risorsa permanente.
- Elimina una risorsa permanente.