ベクトル検索を使用する前に、エンベディング モデルを選択し、データを準備して、使用するエンドポイントのタイプを決める必要があります。このページでは、これらの作業に関する情報について説明します。
エンベディングを準備する
ベクトル検索を使用するには、エンベディングを準備する必要があります。エンベディングがすでにある場合は、エンドポイントを選択するに進みます。
エンベディングの作成手順は次のとおりです。
エンベディング モデルを選択する: さまざまな機能を提供する外部エンベディング モデルが多数あります。ユースケースに応じて、次のいずれかのタイプのモデルを選択します。
すぐに使える: テキスト / 画像のみの関連性により、テキストとテキスト、または画像とテキストを意味的に照合する場合。これは標準的なユースケースであるため、モデルのトレーニングやチューニングを行う必要はありません。このユースケースでは、Vertex AI の生成 AI が推奨されます。
エンベディング用のカスタムモデル: 独自のデータや特定のユースケースに基づいて、意味的に照合する場合。
データを準備する: データをクリーンアップして前処理し、エンベディング モデルで使用できる形式であることを確認します。
カスタムモデルを使用する場合にエンベディング モデルをトレーニングする: カスタム エンベディング モデル(チューニング)を選択する場合は、モデルをデータでトレーニングします。データのサイズや複雑さによっては、処理に時間がかかる可能性があります。Model Garden のトレーニング済みモデルを使用する場合は、この手順をスキップできます。
エンベディングを生成する: モデルをトレーニングした後、そのモデルを使用してデータのエンベディングを生成します。
エンドポイントを選択する
インデックスを作成したら、エンドポイントにデプロイします。詳細については、パブリック インデックス エンドポイントをデプロイおよび管理すると VPC ネットワークにインデックス エンドポイントをデプロイして管理するをご覧ください。インデックスを作成する前に、必要なエンドポイントの種類を決めておくと便利です。
クエリ インデックスは次のいずれかにデプロイできます。
パブリック エンドポイント: パブリック エンドポイントにデプロイする場合は、ネットワークを設定する必要はありません。パブリック ネットワークはレイテンシが若干高くなりますが、短時間で設定でき、保守も簡単です。
プライベート エンドポイント: VPC を使用する場合は、まずネットワークを設定する必要があります。ベクトル検索は、2 種類のプライベート ネットワークをサポートしています。
ネットワーク レイテンシを抑えるための VPC ネットワーク ピアリング接続。
Private Service Connect を使用すると、異なるグループ、チーム、プロジェクト、組織に属する VPC ネットワーク全体でサービスをプライベートに利用できます。
次のステップ
エンベディングを生成してインデックスのデプロイ先を決めたら、インデックスを構成します。
- 入力データの形式と構造で構成方法を確認する
- ノートブックのチュートリアルを使用してベクトル検索インデックスを作成する方法を学習する
- インデックスの管理方法を学習する