Vertex AI Workbench インスタンスで予約を使用する

Vertex AI Workbench インスタンスで VM リソースが必要なときに利用できるようにするには、Compute Engine の予約を使用します。予約を使用すると、Compute Engine ゾーンリソースのキャパシティを確実に確保できます。

制限事項と要件

Vertex AI Workbench インスタンスで予約を消費する場合は、Compute Engine 予約のすべての制限が適用されます。詳細については、予約の仕組みをご覧ください。

また、Vertex AI Workbench インスタンスで予約を使用する場合は、次の制限と要件が適用されます。

  • Vertex AI Workbench インスタンスの予約は限定公開プレビューです。アクセスをリクエストするには、アクセス リクエスト ページをご覧ください。

  • 確約利用割引は適用されません。

  • Vertex AI Workbench で予約を使用するには、Notebooks API を使用する必要があります。Google Cloud コンソールを使用して Vertex AI Workbench で予約を使用することはできません。

始める前に

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Compute Engine and Notebooks API を有効にします。

    API を有効にする

  4. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  5. Compute Engine and Notebooks API を有効にします。

    API を有効にする

必要なロール

Vertex AI Workbench インスタンスの使用に必要な権限がユーザー アカウントに付与されるように、プロジェクトに対する次の IAM ロールをユーザー アカウントに付与するよう管理者に依頼してください。

ロールの付与の詳細については、アクセスの管理をご覧ください。

管理者は、カスタムロールや他の事前定義ロールを使用して、必要な権限をユーザー アカウントに付与することもできます。

予約を作成する

  1. Compute Engine の予約を作成します。単一のプロジェクト予約にすることも、共有予約にすることもできます。詳細については、次のドキュメントをご覧ください。

    この予約に GPU アクセラレータを含めることができます。

既存のインスタンスで予約を使用する

REST API を使用して、Vertex AI Workbench インスタンスに予約を追加できます。

リクエストのデータを使用する前に、次のように置き換えます。

  • PROJECT_ID: プロジェクト ID
  • LOCATION: インスタンスが配置されているゾーン
  • INSTANCE_NAME: インスタンスの名前
  • MACHINE_TYPE: インスタンスのマシンタイプを変更します。
  • RESERVATION_TYPE: 予約のタイプ
  • RESERVATION_NAME: 予約の名前

HTTP メソッドと URL:

POST http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

リクエストの本文(JSON):

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
成功した場合、レスポンスの本文には Operation のインスタンスが含まれます。

予約の使用を停止する

予約の使用を停止するには、予約を削除します。

他のリソースで予約を引き続き使用し、既存の Vertex AI Workbench インスタンスでは予約を使用しない場合は、インスタンスを削除する必要があります。

課金

予約済みの Compute Engine VM リソースは、Vertex AI Workbench インスタンスの実行中に Vertex AI Workbench によって課金されます。Vertex AI Workbench で VM リソースが使用されていない場合は、Compute Engine によって課金されます。

次のステップ