Featuregruppe erstellen

Sie können eine Featuregruppe erstellen, um eine BigQuery-Tabelle oder -Ansicht zu registrieren, die Ihre Featuredaten enthält.

Für jede BigQuery-Tabelle oder -Ansicht, die Sie einer Featuregruppe zuordnen, müssen Sie Folgendes gewährleisten:

  • Das Schema der Datenquelle entspricht den Vorbereitungsrichtlinien für die Datenquelle.

  • Die Datenquelle enthält die Entitäts-IDs als string-Werte in einer Spalte namens entity_id.

  • Die Datenquelle enthält die Feature-Zeitstempel vom Typ timestamp in einer Spalte namens feature_timestamp.

Nachdem Sie eine Featuregruppe erstellt und die BigQuery-Datenquelle verknüpft haben, können Sie Features erstellen, um sie den Spalten in der Datenquelle zuzuordnen. Optional können Sie beim Erstellen der Featuregruppe eine Datenquelle angeben. Sie müssen jedoch eine Datenquelle angeben, bevor Sie Features erstellen.

Die Registrierung Ihrer Datenquelle mithilfe von Featuregruppen und Features hat folgende Vorteile:

  • Sie können eine Featureansicht für die Onlinebereitstellung definieren, indem Sie bestimmte Featurespalten aus mehreren BigQuery-Datenquellen verwenden.

  • Sie können die Daten als Zeitachse formatieren, indem Sie die Spalte feature_timestamp einfügen. Vertex AI Feature Store stellt nur die neuesten Featurewerte aus den Featuredaten bereit und schließt Verlaufsdaten aus.

Im folgenden Beispiel werden eine Featuregruppe erstellt und eine BigQuery-Datenquelle verknüpft.

Console

Gehen Sie nach der folgenden Anleitung vor, um eine Featuregruppe mit der Google Cloud Console zu erstellen.

  1. Rufen Sie im Abschnitt "Vertex AI" der Google Cloud Console die Seite Feature Store auf.

    Zur Seite „Feature Store“

  2. Klicken Sie im Abschnitt Funktionsgruppen auf Erstellen, um den Bereich Allgemeine Informationen auf der Seite Featuregruppe erstellen zu öffnen.

  3. Geben Sie den Namen der Featuregruppe an.

  4. Optional: Klicken Sie zum Hinzufügen von Labels auf Label hinzufügen und geben Sie den Namen und den Wert des Labels an. Sie können einer Featuregruppe mehrere Labels hinzufügen.

  5. Klicken Sie im Feld BigQuery-Pfad auf Durchsuchen, um die BigQuery-Quelltabelle oder -Ansicht auszuwählen, die mit der Featuregruppe verknüpft werden soll.

  6. Optional: Klicken Sie in der Liste Spalte "Entitäts-ID" auf die Spalte für die Entitäts-ID in der BigQuery-Quelltabelle oder -Ansicht.

  7. Klicken Sie auf Weiter.

  8. Klicken Sie im Bereich Registrieren auf eine der folgenden Optionen, um anzugeben, ob Sie der neuen Featuregruppe Funktionen hinzufügen möchten:

    • Alle Spalten aus der BigQuery-Tabelle einbeziehen: Erstellen Sie innerhalb der Featuregruppe für alle Spalten in der BigQuery-Quelltabelle oder -Ansicht Features.

    • Features manuell eingeben: Sie können Features basierend auf bestimmten Spalten in der BigQuery-Quelle erstellen. Geben Sie für jedes Feature einen Featurenamen ein und klicken Sie in der Liste auf den entsprechenden BigQuery-Quellspaltennamen.

      Wenn Sie weitere Features hinzufügen möchten, klicken Sie auf Weiteres Feature hinzufügen.

    • Leere Featuregruppe erstellen: Erstellen Sie die Featuregruppe, ohne ihr Features hinzuzufügen.

  9. Klicken Sie auf Erstellen.

REST

Senden Sie zum Erstellen einer Ressource FeatureGroup eine Anfrage POST mit der Methode featureGroups.create.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • LOCATION_ID: die Region, in der Sie die Featuregruppe erstellen möchten, z. B. us-central1.
  • PROJECT_ID: Ihre Projekt-ID.
  • FEATUREGROUP_NAME: der Name der neuen Featuregruppe, die Sie erstellen möchten.
  • BIGQUERY_SOURCE_URI: URI der BigQuery-Quelltabelle oder -Ansicht, die Sie für die Featuregruppe registrieren möchten.

HTTP-Methode und URL:

POST http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME

JSON-Text der Anfrage:

{
  "big_query": {
    "big_query_source": {
      "input_uri": "BIGQUERY_SOURCE_URI"
    }
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "http://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content

Sie sollten in etwa folgende JSON-Antwort erhalten:

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T03:00:13.060636Z",
      "updateTime": "2023-09-18T03:00:13.060636Z"
    }
  }
}

Nächste Schritte