Dopo aver creato l'indice ed eseguito il deployment, puoi eseguire delle query per ottenere i vicini più vicini.
Ecco alcuni esempi di una query di corrispondenza per trovare i primi vicini più prossimi utilizzando l'algoritmo dei vicini più vicini k (k-NN).
Esempi di query per l'endpoint pubblico
Python
Python
Curl
Il publicEndpointDomainName
elencato di seguito è disponibile nella sezione
Esegui il deployment.
$ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" http://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312:findNeighbors -d '{deployed_index_id: "test_index_public1", queries: [{datapoint: {datapoint_id: "0", feature_vector: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}, neighbor_count: 5}]}'
Questo esempio di curl mostra come effettuare chiamate dai client http(s)
, anche se l'endpoint pubblico supporta il doppio protocollo per le chiamate RESTful e grpc_cli
.
$ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" http://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/${PROJECT_ID}/locations/us-central1/indexEndpoints/${INDEX_ENDPOINT_ID}:readIndexDatapoints -d '{deployed_index_id:"test_index_public1", ids: ["606431", "896688"]}'
Console
Usa queste istruzioni per eseguire query su un indice di cui è stato eseguito il deployment su un endpoint pubblico dalla console.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Deployment e utilizzo. Seleziona Ricerca vettoriale.
- Seleziona l'indice su cui vuoi eseguire una query. Si apre la pagina Informazioni indice.
- Scorri verso il basso fino alla sezione Indici di cui è stato eseguito il deployment e seleziona l'indice di cui vuoi eseguire la query. Viene visualizzata la pagina Informazioni sull'indice di cui è stato eseguito il deployment.
- Nella sezione Indice query, seleziona i parametri di query. Puoi scegliere di eseguire query in base a un vettore o a un punto dati specifico.
- Esegui la query utilizzando il comando curl fornito o eseguendola con Cloud Shell.
- Se utilizzi Cloud Shell, seleziona Esegui in Cloud Shell.
- Esegui in Cloud Shell.
- I risultati restituiscono i vicini più prossimi.
Per un esempio end-to-end di come creare un indice, di come eseguirne il deployment su un endpoint pubblico e come eseguire query, consulta il blocco note ufficiale: Using Vector Search and Vertex AI Embeddings for Text for StackOverflow Domande.
Impostazioni del momento della query che influiscono sulle prestazioni
I seguenti parametri relativi al tempo di query possono influire su latenza, disponibilità e costi quando utilizzi Vector Search. Queste indicazioni si applicano alla maggior parte dei casi. Tuttavia, ti consigliamo sempre di sperimentare le configurazioni per assicurarti che funzionino al tuo caso d'uso.
Per le definizioni dei parametri, consulta Parametri di configurazione dell'indice.
Parametro | Informazioni | Impatto sulle prestazioni |
---|---|---|
approximateNeighborsCount |
Indica all'algoritmo il numero di risultati approssimativi da recuperare da ogni shard.
Il valore di |
L'aumento del valore di
La riduzione del valore di
|
setNeighborCount |
Specifica il numero di risultati che la query deve restituire. |
I valori inferiori o uguali a 300 rimangono efficaci nella maggior parte dei casi d'uso. Per valori più grandi, esegui il test per il tuo caso d'uso specifico. |
fractionLeafNodesToSearch |
Controlla la percentuale di nodi foglia da visitare quando cerchi i vicini più prossimi. Questo valore è correlato a leafNodeEmbeddingCount in quanto maggiore è il numero di incorporamenti per nodo foglia, maggiore è il numero di dati esaminati per foglia.
|
L'aumento del valore di
La diminuzione del valore di
|
Passaggi successivi
- Scopri come aggiornare e ricreare l'indice
- Scopri come filtrare le corrispondenze vettoriali
- Scopri come monitorare un indice.