Usa reservas con instancias de Vertex AI Workbench

Para asegurarte de que los recursos de VM estén disponibles cuando tus instancias de Vertex AI Workbench los necesiten, puedes usar las reservas de Compute Engine. Las reservas proporcionan un nivel de seguridad alto a fin de obtener capacidad para los recursos zonales de Compute Engine.

Limitaciones y requisitos

Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.

Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican los siguientes requisitos y limitaciones:

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  3. Habilita las API de Compute Engine and Notebooks.

    Habilita las API

  4. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  5. Habilita las API de Compute Engine and Notebooks.

    Habilita las API

Roles obligatorios

Para garantizar que tu cuenta de usuario tenga los permisos necesarios para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que le otorgue a tu cuenta de usuario los siguientes roles de IAM en el proyecto:

Si quieres obtener más información para otorgar roles, consulta Administra el acceso.

Es posible que tu administrador también pueda otorgar a tu cuenta de usuario los permisos necesarios a través de roles personalizados o de otros roles predefinidos.

Crea una reserva

  1. Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:

    La reserva puede incluir aceleradores de GPU.

Usa tu reserva con una instancia existente

Puedes agregar tu reserva a una instancia de Vertex AI Workbench con la API de REST.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • PROJECT_ID: el ID de tu proyecto
  • LOCATION: La zona en la que se encuentra la instancia.
  • INSTANCE_NAME: el nombre de tu instancia
  • MACHINE_TYPE: el tipo de máquina de tu instancia
  • RESERVATION_TYPE: el tipo de reserva.
  • RESERVATION_NAME: el nombre de tu reserva

HTTP method and URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Cuerpo JSON de la solicitud:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Si se ejecuta correctamente, el cuerpo de la respuesta contiene una instancia de operación.

Deja de usar tu reserva

Para dejar de usar tu reserva, puedes borrar tu reserva.

Si deseas seguir usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.

Facturación

Vertex AI Workbench factura los recursos reservados de VM de Compute Engine mientras se ejecuta la instancia de Vertex AI Workbench, y Compute Engine los factura cuando Vertex AI Workbench no usa los recursos de VM.

¿Qué sigue?