Vertex AI の生成 AI の Inference API エラー

このガイドでは、生成 AI の Model API の使用時に発生する可能性のあるエラーの一覧を示します。これらのエラーは、Google Cloud API のエラーモデルに従っています。このモデルでは、生成 AI モデルに固有の原因と解決策に関するガイダンスを提供することが推奨されています。

API エラー

次の表に、API のエラーコードと説明を示します。

HTTP エラーコード 標準的なエラーコード 原因 解決策
400 INVALID_ARGUMENT / FAILED_PRECONDITION リクエストが API 検証に失敗しました。または、許可リストに登録する必要のあるモデルまたは組織のポリシーで禁止されているモデルにアクセスしようとしています。 リクエストがモデルの入力トークンの上限を超えています。 リクエスト パラメータ、トークン数、その他のパラメータについては、生成 AI の Model API リファレンスをご覧ください。
403 PERMISSION_DENIED クライアントに API を呼び出すための十分な権限がありません。 画像または動画リソースがホストされている Cloud Storage バケットにアクセスするための権限がサービス アカウントにありません。 1. 必要な API がすべて有効であり、該当する Vertex AI サービスにアクセスするための権限がサービス アカウントにあることを確認します。

2. Vertex AI のプロダクトおよびプロジェクトごとのサービス アカウント(P4SA)に、入力で参照されているリソースにアクセスするために必要な権限が付与されていることを確認します。
404 NOT_FOUND 指定された URL に有効なオブジェクトがありません。 ストレージの URL に画像ファイルがありません。 ファイルの場所を確認して修正してください。
429 RESOURCE_EXHAUSTED エラー メッセージによっては、次の原因でエラーが発生している可能性があります。

1. API 割り当てが上限を超えています。

2. 共有サーバー容量のため、サーバーが過負荷状態になっています。
Gemini API のリクエスト数が 1 分あたりの上限を超えています。 1. Vertex AI の生成 AI の割り当て上限を確認します。必要に応じて、割り当ての増加を申請します。

2. 数秒後に再試行します。数時間経過してもエラーが解消されない場合は、Vertex AI サポートにお問い合わせください。
499 CANCELLED リクエストがクライアントによってキャンセルされました。
500 UNKNOWN / INTERNAL 過負荷または依存関係の失敗によるサーバーエラー。 サービスが一時的に過負荷状態になっているため、リクエストがスロットリングされます。 数秒後に再試行します。数時間経過してもエラーが解消されない場合は、Vertex AI サポートにお問い合わせください。
503 UNAVAILABLE サービスが一時的に利用できません。 サーバーが受信リクエストに応答しません。 この利用不可ステータスは一時的な場合もあります。エラーが解消されない場合は、Vertex AI サポートにお問い合わせください。
504 DEADLINE_EXCEEDED クライアントに、サーバーのデフォルトの期限(10 分)よりも短い期限が設定されています。クライアントが指定した期限内にリクエストが完了しませんでした。 クライアントに指定されている期限の延長を検討してください。

エラーを処理する

トラフィックの急増を避けましょう。スパイクとは、非常に短い時間内にリクエスト数が急激に増加することを指します。トラフィックの急増によって割り当ての適用に問題が生じ、サーバーの過負荷が発生することがあります。

イベントの再試行には注意が必要です。再試行は 2 回までにすることをおすすめします。最小遅延は 1 秒で、その後のリクエストでは指数関数的に増加します。

次のステップ