Hello カスタムトレーニング: カスタム画像分類モデルのトレーニング

このページでは、Vertex AI で TensorFlow Keras トレーニングアプリケーションを実行する方法について説明します。このモデルは、花の画像を種類別に分類できる画像分類モデルをトレーニングします。

このチュートリアルには複数のページが含まれます。

各ページは、前のページのチュートリアルの手順をすでに実施していることを前提としています。

このドキュメントの以降の内容は、このチュートリアルの最初のページの手順を実施したときに作成したものと同じ Cloud Shell 環境を使用していることを前提としています。元の Cloud Shell セッションが開かれていない場合は、次の手順を行ってその環境に戻ることができます。

Google Cloud コンソールで、「Cloud Shell をアクティブにする」をクリックします。

Cloud Shell をアクティブにする
Cloud Shell セッションで次のコマンドを実行します。
```
cd hello-custom-sample
```

カスタムトレーニングパイプラインを実行する

このセクションでは、Cloud Storage にアップロードしたトレーニングパッケージを使用して Vertex AI カスタムトレーニングパイプラインを実行する方法について説明します。

Google Cloud コンソールの [Vertex AI] セクションで、[トレーニングパイプライン] ページに移動します。

[トレーニングパイプライン] に移動
[作成] をクリックして、[新しいモデルのトレーニング] ペインを開きます。
トレーニング方法の選択ステップで、次の手順を行います。
1. [データセット] プルダウンリストで、[管理されているデータセットなし] を選択します。この特定のトレーニングアプリケーションは、マネージド Vertex AI データセットではなく TensorFlow データセットライブラリからデータを読み込みます。
2. [カスタムトレーニング（上級者向け）] が選択されていることを確認します。
[続行] をクリックします。
[モデルの詳細] ステップの [名前] フィールドに「hello_custom」と入力します。[続行] をクリックします。
[トレーニングコンテナ] ステップで、Cloud Storage にアップロードしたトレーニングパッケージを使用するために必要な情報を Vertex AI に提供します。
1. [Prebuilt container] を選択します。
2. [モデルフレームワーク] プルダウンリストで [TensorFlow] を選択します。
3. [モデルフレームワークのバージョン] プルダウンリストで、[2.3] を選択します。
4. [パッケージの場所] フィールドに「cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz」と入力します。
5. [Python モジュール] フィールドに「trainer.task」と入力します。trainer は tarball の Python パッケージの名前です。task.py にはトレーニングコードが含まれています。trainer.task は、Vertex AI を実行するモジュールの名前です。
6. [Model output directory] フィールドで、[Browse] をクリックします。[フォルダの選択] ペインで次の手順を行います。
  1. Cloud Storage バケットに移動します。
  2. [新しいフォルダを作成] をクリックします。
  3. 新しいフォルダの名前を output とします。次に [作成] をクリックします。
  4. [選択] をクリックします。
  フィールドの値が gs://BUCKET_NAME/output であることを確認します。ここで、BUCKET_NAME は Cloud Storage バケットの名前です。
  
  この値は、Vertex AI の baseOutputDirectory API フィールドに渡されます。この値に基づいて、トレーニングアプリケーションが実行時にアクセスする複数の環境変数が設定されます。
  
  たとえば、このフィールドを gs://BUCKET_NAME/output に設定すると、AIP_MODEL_DIR 環境変数は gs://BUCKET_NAME/output/model に設定されます。トレーニングが終了すると、Vertex AI は AIP_MODEL_DIR ディレクトリのアーティファクトを使用してモデルリソースを作成します。
  
  詳しくは、このフィールドで設定される環境変数をご覧ください。
[続行] をクリックします。
オプションの [ハイパーパラメータ] ステップで、[Enable hyperparameter tuning] チェックボックスがオフになっていることを確認します。このチュートリアルでは、ハイパーパラメータ調整は使用しません。[続行] をクリックします。
[コンピューティングと料金] ステップで、カスタムトレーニングジョブのリソースを割り当てます。
1. [リージョン] プルダウンリストで、[us-central1（アイオワ）] を選択します。
2. [Machine type] プルダウンリストで、[標準] セクションから [n1-standard-4] を選択します。
このチュートリアルでは、アクセラレータやワーカープールを追加しないでください。[続行] をクリックします。
[予測コンテナ] ステップで、Vertex AI が予測を行うために必要な情報を提供します。
1. [Prebuilt container] を選択します。
2. [Prebuilt container settings] セクションで、次の操作を行います。
  1. [モデルフレームワーク] プルダウンリストで [TensorFlow] を選択します。
  2. [モデルフレームワークのバージョン] プルダウンリストで、[2.3] を選択します。
  3. [アクセラレータタイプ] プルダウンリストで、[なし] を選択します。
  4. [モデルディレクトリ] フィールドの値が gs://BUCKET_NAME/output になっていることを確認します。ここで、BUCKET_NAME は Cloud Storage バケットの名前です。これは、前のステップで指定した [Model output directory] の値と一致します。
3. [予測 schemata] セクションのフィールドは空白のままにします。
[トレーニングを開始] をクリックして、カスタムトレーニングパイプラインを開始します。

[トレーニング] ページに、hello_custom という名前の新しいトレーニングパイプラインが表示されます（ページの更新が必要になる場合があります）。トレーニングパイプラインは、次の 2 つの主要な処理を行います。

トレーニングパイプラインが、hello_custom-custom-job という名前のカスタムジョブリソースを作成します。しばらくすると、[トレーニング] セクションの [CUSTOM JOB] ページにこのリソースが表示されます。

[CUSTOM JOB] に移動

カスタムジョブは、このセクションで指定されたコンピューティングリソースを使用してトレーニングアプリケーションを実行します。
カスタムジョブが完了すると、トレーニングパイプラインにより、トレーニングアプリケーションが作成したアーティファクトが検出されます。このアーティファクトは Cloud Storage バケットの output/model/ ディレクトリに作成されます。これらのアーティファクトを使用してモデルリソースを作成します。

トレーニングをモニタリングする

トレーニングログを表示する方法は次のとおりです。

Google Cloud コンソールの [Vertex AI] セクションで、[CUSTOM JOBS] ページに移動します。

[CUSTOM JOBS] に移動
作成した CustomJob の詳細を表示するには、リスト内の hello_custom-custom-job をクリックします。
ジョブの詳細ページで、[ログを表示] をクリックします。

トレーニング済みのモデルを表示する

カスタムトレーニングパイプラインが完了すると、Google Cloud コンソールの [Vertex AI] セクションの [モデル] ページにトレーニング済みモデルが表示されます。

[モデル] に移動

モデルの名前は hello_custom です。

次のステップ

このチュートリアルの次のページの説明に沿って、トレーニング済みの ML モデルから予測を行います。

プロジェクトと環境を設定する

カスタム画像分類モデルから取得した予測情報の提供

Hello カスタム トレーニング: カスタム画像分類モデルのトレーニング

カスタム トレーニング パイプラインを実行する

トレーニングをモニタリングする

トレーニング済みのモデルを表示する

次のステップ

Hello カスタムトレーニング: カスタム画像分類モデルのトレーニング

カスタムトレーニングパイプラインを実行する