始める前に

ベクトル検索を使用する前に、エンベディング モデルを選択し、データを準備して、使用するエンドポイントのタイプを決める必要があります。このページでは、これらの作業に関する情報について説明します。

エンベディングを準備する

ベクトル検索を使用するには、エンベディングを準備する必要があります。エンベディングがすでにある場合は、エンドポイントを選択するに進みます。

エンベディングの作成手順は次のとおりです。

  1. エンベディング モデルを選択する: さまざまな機能を提供する外部エンベディング モデルが多数あります。ユースケースに応じて、次のいずれかのタイプのモデルを選択します。

    • すぐに使える: テキスト / 画像のみの関連性により、テキストとテキスト、または画像とテキストを意味的に照合する場合。これは標準的なユースケースであるため、モデルのトレーニングやチューニングを行う必要はありません。このユースケースでは、Vertex AI の生成 AI が推奨されます。

    • エンベディング用のカスタムモデル: 独自のデータや特定のユースケースに基づいて、意味的に照合する場合。

  2. データを準備する: データをクリーンアップして前処理し、エンベディング モデルで使用できる形式であることを確認します。

  3. カスタムモデルを使用する場合にエンベディング モデルをトレーニングする: カスタム エンベディング モデル(チューニング)を選択する場合は、モデルをデータでトレーニングします。データのサイズや複雑さによっては、処理に時間がかかる可能性があります。Model Garden のトレーニング済みモデルを使用する場合は、この手順をスキップできます。

  4. エンベディングを生成する: モデルをトレーニングした後、そのモデルを使用してデータのエンベディングを生成します。

エンドポイントを選択する

インデックスを作成したら、エンドポイントにデプロイします。詳細については、パブリック インデックス エンドポイントをデプロイおよび管理するVPC ネットワークにインデックス エンドポイントをデプロイして管理するをご覧ください。インデックスを作成する前に、必要なエンドポイントの種類を決めておくと便利です。

クエリ インデックスは次のいずれかにデプロイできます。

  • パブリック エンドポイント: パブリック エンドポイントにデプロイする場合は、ネットワークを設定する必要はありません。パブリック ネットワークはレイテンシが若干高くなりますが、短時間で設定でき、保守も簡単です。

  • プライベート エンドポイント: VPC を使用する場合は、まずネットワークを設定する必要があります。ベクトル検索は、2 種類のプライベート ネットワークをサポートしています。

次のステップ

エンベディングを生成してインデックスのデプロイ先を決めたら、インデックスを構成します。