Usar reservas com instâncias do Vertex AI Workbench

É possível usar reservas do Compute Engine para garantir que os recursos da VM estejam disponíveis quando suas instâncias do Vertex AI Workbench precisarem deles. As reservas fornecem um nível alto de garantia da capacidade dos recursos zonais do Compute Engine.

Limitações e requisitos

Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.

Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:

As reservas para instâncias do Vertex AI Workbench estão em visualização particular. Para solicitar acesso, consulte a página de solicitação de acesso.
Os descontos por compromisso de uso não se aplicam.
O uso de reservas com o Vertex AI Workbench só está disponível pela API Notebooks. Não é possível usar reservas com o Vertex AI Workbench usando o console do Google Cloud.

Antes de começar

Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

Acessar o seletor de projetos

Ative as APIs Compute Engine and Notebooks.

Ative as APIs

No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

Acessar o seletor de projetos

Ative as APIs Compute Engine and Notebooks.

Ative as APIs

Funções exigidas

Para garantir que sua conta de usuário tenha as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder à sua conta de usuário os seguintes papéis do IAM no projeto:

Administrador do Compute (roles/compute.admin)
Administrador de notebooks (roles/notebooks.admin)

Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.

O administrador também pode conceder à sua conta de usuário as permissões necessárias via papéis personalizados ou outros papéis predefinidos.

Criar uma reserva

Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:
- Criar uma reserva para um único projeto
- Criar uma reserva compartilhada
A reserva pode incluir aceleradores de GPU.

Usar a reserva com uma instância atual

É possível adicionar sua reserva a uma instância do Vertex AI Workbench usando a API REST.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto;
LOCATION: a zona em que a instância está localizada
INSTANCE_NAME: o nome da instância
MACHINE_TYPE: o tipo de máquina da instância
RESERVATION_TYPE: o tipo de reserva
RESERVATION_NAME: o nome da sua reserva

Método HTTP e URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON da solicitação:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content

Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Operation.

Parar de usar sua reserva

Para deixar de usar sua reserva, exclua-a.

Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.

Faturamento

Os recursos reservados de VM do Compute Engine são cobrados pelo Vertex AI Workbench enquanto a instância está em execução e são cobrados pelo Compute Engine quando os recursos da VM não estão sendo usados pelo Vertex AI Workbench.

A seguir

Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.