障害ポリシーを構成する

aiplatform.PipelineJob クラスの failure_policy パラメータを使用すると、いずれかのタスクが失敗した場合にパイプラインが直ちに失敗するかどうかを構成できます。

Vertex AI Pipelines では、次の障害ポリシー構成がサポートされています。

  • フェイル ファストfailure_policy = 'fast'): タスクの失敗後にパイプラインが新しいタスクのスケジュール設定を停止するように設定する場合は、この構成を選択します。すでにスケジュールされているタスクは、完了するまで実行されます。

  • フェイルスローfailure_policy = 'slow'): タスクが失敗した後もパイプラインの実行を継続する場合は、この構成を選択します。パイプラインは、すべてのタスクが実行されるまで実行され続けます。

Vertex AI SDK for Python を使用してパイプラインの障害ポリシーを構成するには、次のコードサンプルを使用します。


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

次のように置き換えます。

  • DISPLAY_NAME: パイプラインの名前。Google Cloud コンソールに表示されます。

  • COMPILED_PIPELINE_PATH: コンパイルされたパイプライン YAML ファイルのパス。ローカルパスまたは Google Cloud Storage URI を指定できます。

  • PIPELINE_ROOT: パイプライン サービス アカウントがアクセスできる Cloud Storage URI を指定します。パイプライン実行のアーティファクトはパイプライン ルート内に保存されます。

  • PROJECT_ID: このパイプラインが実行される Google Cloud プロジェクト。

  • LOCATION: パイプラインが実行されるリージョン。Vertex AI Pipelines が利用可能なリージョンの詳細については、Vertex AI ロケーション ガイドをご覧ください。このパラメータを設定しないと、aiplatform.init で設定されたデフォルトのロケーションが使用されます。

  • FAILURE_POLICY: 省略可。パイプライン全体の障害ポリシーを指定します。次の構成を使用できます。

    • 1 つのタスクが失敗した後、パイプラインが失敗するように構成するには、「fast」と入力します。

    • 1 つのタスクが失敗した後もタスクのスケジュールを継続するようにパイプラインを構成するには、「slow」と入力します。

    このパラメータを設定しないと、エラーポリシーの構成はデフォルトの slow に設定されます。