Vertex AI Workbench 인스턴스에 예약 사용

Compute Engine 예약을 사용하면 Vertex AI Workbench 인스턴스에 필요할 때 VM 리소스를 사용할 수 있도록 보장할 수 있습니다. 예약을 이용하면 높은 수준의 확신으로 Compute Engine 영역별 리소스의 용량을 확보할 수 있습니다.

제한사항 및 요구사항

Vertex AI Workbench 인스턴스에 예약이 사용될 때는 Compute Engine 예약의 모든 제한사항이 적용됩니다. 자세한 내용은 예약 작동 방식을 참조하세요.

또한 Vertex AI Workbench 인스턴스에 예약을 사용할 때는 다음과 같은 제한사항 및 요구사항이 적용됩니다.

  • Vertex AI Workbench 인스턴스에 대한 예약은 비공개 미리보기 상태입니다. 액세스를 요청하려면 액세스 요청 페이지를 참조하세요.

  • 약정 사용 할인은 적용되지 않습니다.

  • Vertex AI Workbench에 예약 사용은 Notebooks API를 통해서만 가능합니다. Google Cloud 콘솔을 사용해서 Vertex AI Workbench에 예약을 사용하는 방법은 지원되지 않습니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. API Compute Engine and Notebooks 사용 설정

    API 사용 설정

  4. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  5. API Compute Engine and Notebooks 사용 설정

    API 사용 설정

필요한 역할

Vertex AI Workbench 인스턴스에 예약을 사용하는 데 필요한 권한이 사용자 계정에 포함되도록 하려면 관리자에게 문의해서 프로젝트에 대해 다음 IAM 역할을 사용자 계정에 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 액세스 관리를 참조하세요.

관리자는 커스텀 역할이나 다른 사전 정의된 역할을 통해 사용자 계정에 필요한 권한을 부여할 수도 있습니다.

예약 만들기

  1. Compute Engine 예약을 만듭니다. 이 예약은 단일 프로젝트 예약 또는 공유 예약일 수 있습니다. 자세한 내용은 다음 문서를 참조하세요.

    예약에는 GPU 가속기가 포함될 수 있습니다.

기존 인스턴스에 예약 사용

REST API를 사용해서 Vertex AI Workbench 인스턴스에 예약을 추가할 수 있습니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • PROJECT_ID: 프로젝트 ID입니다.
  • LOCATION: 인스턴스가 있는 영역입니다.
  • INSTANCE_NAME: 인스턴스의 이름입니다.
  • MACHINE_TYPE: 인스턴스의 머신 유형입니다.
  • RESERVATION_TYPE: 예약 유형입니다.
  • RESERVATION_NAME: 예약의 이름입니다.

HTTP 메서드 및 URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

JSON 요청 본문:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
요청이 성공하면 응답 본문에 Operation의 인스턴스가 포함됩니다.

예약 사용 중지

예약 사용을 중지하려면 예약을 삭제하면 됩니다.

다른 리소스에 예약을 계속 사용하고 싶지만 기존 Vertex AI Workbench 인스턴스에 사용되지 않도록 하려면 인스턴스를 삭제해야 합니다.

청구

예약된 Compute Engine VM 리소스는 Vertex AI Workbench 인스턴스가 실행되는 동안 Vertex AI Workbench에서 청구되고, Vertex AI Workbench에 VM 리소스가 사용되지 않을 때는 Compute Engine에서 청구됩니다.

다음 단계