Crea un gruppo di caratteristiche

Puoi creare un gruppo di caratteristiche per registrare una tabella o una vista BigQuery contenente i tuoi dati delle caratteristiche.

Per qualsiasi tabella o vista BigQuery associata a un gruppo di caratteristiche, devi garantire quanto segue:

  • Lo schema dell'origine dati è conforme alle linee guida per la preparazione dell'origine dati.

  • L'origine dati contiene gli ID entità come valori string in una colonna denominata entity_id.

  • L'origine dati contiene i timestamp delle funzionalità di tipo timestamp in una colonna denominata feature_timestamp.

Dopo aver creato un gruppo di funzionalità e aver associato l'origine dati BigQuery, puoi creare funzionalità da associare alle colonne nell'origine dati. È facoltativo specificare un'origine dati durante la creazione del gruppo di funzionalità. Tuttavia, devi specificare un'origine dati prima di creare le caratteristiche.

La registrazione dell'origine dati utilizzando gruppi di funzionalità e funzionalità presenta i seguenti vantaggi:

  • Puoi definire una visualizzazione delle caratteristiche per la pubblicazione online utilizzando colonne delle caratteristiche specifiche provenienti da più origini dati BigQuery.

  • Puoi formattare i dati come serie temporali includendo la colonna feature_timestamp. Vertex AI Feature Store pubblica solo i valori delle funzionalità più recenti provenienti dai dati delle caratteristiche ed esclude i valori storici.

Utilizza l'esempio seguente per creare un gruppo di funzionalità e associare un'origine dati BigQuery.

Console

Segui le istruzioni riportate di seguito per creare un gruppo di funzionalità utilizzando la console Google Cloud.

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Feature Store.

    Vai alla pagina Feature Store

  2. Nella sezione Gruppi di funzionalità, fai clic su Crea per aprire il riquadro Informazioni di base nella pagina Crea gruppo di funzionalità.

  3. Specifica il Nome del gruppo di funzionalità.

  4. (Facoltativo) Per aggiungere etichette, fai clic su Aggiungi etichetta e specifica il nome e il valore dell'etichetta. Puoi aggiungere più etichette a un gruppo di funzionalità.

  5. Nel campo Percorso BigQuery, fai clic su Sfoglia per selezionare la tabella o la vista di origine BigQuery da associare al gruppo di caratteristiche.

  6. (Facoltativo) Nell'elenco Colonna ID entità, fai clic sulla colonna ID entità dalla tabella o dalla vista di origine BigQuery.

  7. Fai clic su Continua.

  8. Nel riquadro Registra, fai clic su una delle seguenti opzioni per indicare se vuoi aggiungere funzionalità al nuovo gruppo di funzionalità:

    • Includi tutte le colonne della tabella BigQuery: crea funzionalità all'interno del gruppo di caratteristiche per tutte le colonne nella tabella o nella vista di origine BigQuery.

    • Inserisci manualmente le caratteristiche: crea funzionalità in base a colonne specifiche nell'origine BigQuery. Per ogni funzionalità, inserisci un Nome funzionalità e fai clic sul nome della colonna di origine BigQuery corrispondente nell'elenco.

      Per aggiungere altre funzionalità, fai clic su Aggiungi un'altra funzionalità.

    • Crea un gruppo di caratteristiche vuoto: crea il gruppo di caratteristiche senza aggiungervi funzionalità.

  9. Fai clic su Crea.

REST

Per creare una risorsa FeatureGroup, invia una richiesta POST utilizzando il metodo featureGroups.create.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • LOCATION_ID: regione in cui vuoi creare il gruppo di funzionalità, ad esempio us-central1.
  • PROJECT_ID: l'ID del tuo progetto.
  • FEATUREGROUP_NAME: il nome del nuovo gruppo di funzionalità che vuoi creare.
  • BIGQUERY_SOURCE_URI: URI della tabella o della vista di origine BigQuery che vuoi registrare per il gruppo di caratteristiche.

Metodo HTTP e URL:

POST http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME

Corpo JSON della richiesta:

{
  "big_query": {
    "big_query_source": {
      "input_uri": "BIGQUERY_SOURCE_URI"
    }
  }
}

Per inviare la richiesta, scegli una delle seguenti opzioni:

arricciatura

Salva il corpo della richiesta in un file denominato request.json ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente:

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T03:00:13.060636Z",
      "updateTime": "2023-09-18T03:00:13.060636Z"
    }
  }
}

Passaggi successivi