Usa reservas con instancias de Vertex AI Workbench
Para asegurarte de que los recursos de VM estén disponibles cuando tus instancias de Vertex AI Workbench los necesiten, puedes usar las reservas de Compute Engine. Las reservas proporcionan un nivel de seguridad alto a fin de obtener capacidad para los recursos zonales de Compute Engine.
Limitaciones y requisitos
Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.
Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican los siguientes requisitos y limitaciones:
Las reservas para instancias de Vertex AI Workbench se encuentran en vista previa privada. Para solicitar acceso, consulta la página de solicitud de acceso.
No se aplican los descuentos por compromiso de uso.
El uso de reservas con Vertex AI Workbench solo está disponible a través de la API de Notebooks. No se admite el uso de reservas con Vertex AI Workbench mediante la consola de Google Cloud.
Antes de comenzar
- Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.
-
Habilita las API de Compute Engine and Notebooks.
-
En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.
-
Habilita las API de Compute Engine and Notebooks.
Roles obligatorios
Para garantizar que tu cuenta de usuario tenga los permisos necesarios para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que le otorgue a tu cuenta de usuario los siguientes roles de IAM en el proyecto:
- Administrador de Compute (
roles/compute.admin
) - Administrador de notebooks (
roles/notebooks.admin
)
Si quieres obtener más información para otorgar roles, consulta Administra el acceso.
Es posible que tu administrador también pueda otorgar a tu cuenta de usuario los permisos necesarios a través de roles personalizados o de otros roles predefinidos.
Crea una reserva
Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:
La reserva puede incluir aceleradores de GPU.
Usa tu reserva con una instancia existente
Puedes agregar tu reserva a una instancia de Vertex AI Workbench con la API de REST.
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
PROJECT_ID
: el ID de tu proyectoLOCATION
: La zona en la que se encuentra la instancia.INSTANCE_NAME
: el nombre de tu instanciaMACHINE_TYPE
: el tipo de máquina de tu instanciaRESERVATION_TYPE
: el tipo de reserva.RESERVATION_NAME
: el nombre de tu reserva
HTTP method and URL:
POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Cuerpo JSON de la solicitud:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Deja de usar tu reserva
Para dejar de usar tu reserva, puedes borrar tu reserva.
Si deseas seguir usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.
Facturación
Vertex AI Workbench factura los recursos reservados de VM de Compute Engine mientras se ejecuta la instancia de Vertex AI Workbench, y Compute Engine los factura cuando Vertex AI Workbench no usa los recursos de VM.
¿Qué sigue?
- Para obtener más información sobre las reservas de Compute Engine, consulta Reservas de recursos zonales de Compute Engine.