障害ポリシーを構成する

aiplatform.PipelineJob クラスの failure_policy パラメータを使用すると、いずれかのタスクが失敗した場合にパイプラインが直ちに失敗するかどうかを構成できます。

Vertex AI Pipelines では、次の障害ポリシー構成がサポートされています。

フェイルファスト（failure_policy = 'fast'）: タスクの失敗後にパイプラインが新しいタスクのスケジュール設定を停止するように設定する場合は、この構成を選択します。すでにスケジュールされているタスクは、完了するまで実行されます。
フェイルスロー（failure_policy = 'slow'）: タスクが失敗した後もパイプラインの実行を継続する場合は、この構成を選択します。パイプラインは、すべてのタスクが実行されるまで実行され続けます。

注: パイプラインの failure_policy パラメータを指定しない場合、障害ポリシーの構成はデフォルトで slow に設定されます。

Vertex AI SDK for Python を使用してパイプラインの障害ポリシーを構成するには、次のコードサンプルを使用します。


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

次のように置き換えます。

DISPLAY_NAME: パイプラインの名前。Google Cloud コンソールに表示されます。
COMPILED_PIPELINE_PATH: コンパイルされたパイプライン YAML ファイルのパス。ローカルパスまたは Google Cloud Storage URI を指定できます。
PIPELINE_ROOT: パイプラインサービスアカウントがアクセスできる Cloud Storage URI を指定します。パイプライン実行のアーティファクトはパイプラインルート内に保存されます。
PROJECT_ID: このパイプラインが実行される Google Cloud プロジェクト。
LOCATION: パイプラインが実行されるリージョン。Vertex AI Pipelines が利用可能なリージョンの詳細については、Vertex AI ロケーションガイドをご覧ください。このパラメータを設定しないと、aiplatform.init で設定されたデフォルトのロケーションが使用されます。
FAILURE_POLICY: 省略可。パイプライン全体の障害ポリシーを指定します。次の構成を使用できます。
- 1 つのタスクが失敗した後、パイプラインが失敗するように構成するには、「fast」と入力します。
- 1 つのタスクが失敗した後もタスクのスケジュールを継続するようにパイプラインを構成するには、「slow」と入力します。
このパラメータを設定しないと、エラーポリシーの構成はデフォルトの slow に設定されます。