Utiliser des réservations avec des instances Vertex AI Workbench

Pour vous assurer que des ressources de VM sont disponibles lorsque vos instances Vertex AI Workbench en ont besoin, vous pouvez utiliser des réservations Compute Engine. Les réservations offrent un niveau élevé d'assurance pour l'obtention de la capacité des ressources zonales Compute Engine.

Limites et exigences

Toutes les limites des réservations Compute Engine s'appliquent lorsque les instances Vertex AI Workbench consomment des réservations. Consultez la section Fonctionnement des réservations.

De plus, lorsque vous utilisez des réservations avec des instances Vertex AI Workbench, les limites et exigences suivantes s'appliquent :

  • Les réservations pour les instances Vertex AI Workbench sont en version preview privée. Pour demander l'accès, consultez la page de demande d'accès.

  • Les remises sur engagement d'utilisation ne s'appliquent pas.

  • L'utilisation des réservations avec Vertex AI Workbench n'est disponible que via l'API Notebooks. Il n'est pas possible d'utiliser des réservations avec Vertex AI Workbench à l'aide de la console Google Cloud.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Activer les API Compute Engine and Notebooks.

    Activer les API

  4. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  5. Activer les API Compute Engine and Notebooks.

    Activer les API

Rôles requis

Pour vous assurer que votre compte utilisateur dispose des autorisations nécessaires pour utiliser des réservations avec des instances Vertex AI Workbench, demandez à votre administrateur d'attribuer les rôles IAM suivants à votre compte utilisateur sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Votre administrateur peut également attribuer à votre compte utilisateur les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Créer une réservation

  1. Créez une réservation Compute Engine. Il peut s'agir d'une réservation à projet unique ou d'une réservation partagée. Pour en savoir plus, consultez les documents suivants :

    La réservation peut inclure des accélérateurs de GPU.

Utiliser votre réservation avec une instance existante

Vous pouvez ajouter votre réservation à une instance Vertex AI Workbench à l'aide de l'API REST.

Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :

  • PROJECT_ID : ID de votre projet.
  • LOCATION : zone où se trouve votre instance
  • INSTANCE_NAME : nom de l'instance
  • MACHINE_TYPE : type de machine de votre instance
  • RESERVATION_TYPE : type de réservation
  • RESERVATION_NAME : nom de votre réservation

Méthode HTTP et URL :

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corps JSON de la requête :

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Si la requête aboutit, le corps de la réponse contient une instance d'Opération.

Cesser d'utiliser votre réservation

Pour cesser d'utiliser votre réservation, vous pouvez supprimer votre réservation.

Si vous souhaitez continuer à utiliser votre réservation avec d'autres ressources, mais que vous ne souhaitez pas que votre instance Vertex AI Workbench existante l'utilise, vous devez supprimer l'instance.

Facturation

Les ressources de VM Compute Engine réservées sont facturées par Vertex AI Workbench pendant l'exécution de l'instance Vertex AI Workbench, et sont facturées par Compute Engine lorsque les ressources de VM ne sont pas utilisées par Vertex AI Workbench.

Étapes suivantes