Vorhersagen treffen

Sie können jetzt die Testdaten in df_for_prediction verwenden, um eine Vorhersageanfrage zu stellen. Die Vorhersageanfrage ruft Ihr Modell auf, um vorherzusagen, welche Pinguinart durch die Pinguinmerkmale in jeder Zeile in df_for_prediction repräsentiert wird.

Vorhersagetestdaten vorbereiten

Bevor Sie die Testdaten zum Erstellen von Vorhersagen verwenden können, müssen Sie die Spalte species entfernen. Da die Pinguinarten den von Ihnen vorhergesagten Daten entsprechen, können sie nicht in die Testdaten aufgenommen werden, die zum Erstellen einer Vorhersage verwendet werden. Nachdem Sie die Spalte species entfernt haben, konvertieren Sie die Daten in eine Python-Liste, da dies von der Methode predict als Eingabe verwendet wird. Führen Sie den folgenden Code aus, um Ihre Daten in eine Python-Liste zu konvertieren:

# Remove the species column
df_for_prediction.pop(LABEL_COLUMN)

# Convert data to a Python list
test_data_list = df_for_prediction.values.tolist()

Optional: Testdaten ansehen

Um die Testdaten besser zu verstehen, führen Sie die folgende Codezeile aus, damit Sie sie ansehen können:

test_data_list

In jeder Zeile beziehen sich die entsprechenden Werte in jeder der sechs Spalten auf die folgenden Eigenschaften eines Pinguins:

Säulendiagramm Pinguinmerkmal
0 island: Die Insel, auf der eine Pinguinart vorkommt. Die Zuordnung des Inselwerts ist 0 für Dream, 1 für Biscoe und 2 für Torgersen.
1 culmen_length_mm: Die Länge des Rückens entlang der Schnabeloberseite eines Pinguins.
2 culmen_depth_mm: Die Höhe des Schnabels eines Pinguins.
3 flipper_length_mm: Die Länge des flossenartigen Flügels eines Pinguins.
4 body_mass_g: Die Körpermasse eines Pinguins.
5 sex – Das Geschlecht des Pinguins. 0 ist FEMALE und 1 ist MALE.

Vorhersageanfrage senden

Übergeben Sie die Python-Liste der von Ihnen erstellten Testdaten an die Methode predict des endpoint, um eine Vorhersageanfrage zu erstellen.

Die predict-Methode wertet die Merkmale in jeder Zeile aus und verwendet sie, um vorherzusagen, welche Pinguinart sie darstellen. Führen Sie zum Erstellen der Vorhersagen den folgenden Code aus. Die zurückgegebenen Vorhersagen enthalten eine Liste von Zeilen, wobei jede Zeile drei Spalten hat (Adeliepinguin (Pygoscelis adeliae) (Spalte 1),Zügelpinguin (Pygoscelis antarctica) (Spalte 2) oder Eselspinguin (Pygoscelis papua) (Spalte 3)).

# Get your predictions.
predictions = endpoint.predict(instances=test_data_list)

# View the predictions
predictions.predictions

Jede Spalte in einer Zeile enthält einen Wert. Je höher der Wert, desto größer ist die Wahrscheinlichkeit, dass die durch diese Spalte dargestellte Pinguinart eine korrekte Vorhersage ist. In der folgenden Beispiel-Ausgabezeile für die Vorhersage verwendet das Modell die Merkmale der Beispiel-Pinguin-Datenzeile, um vorherzusagen, dass es sich bei dem Pinguin höchstwahrscheinlich um die Art Adeliepinguin (Pygoscelis adeliae) handelt. Das liegt daran, dass sich der höchste Wert, 0.732703805, in der ersten Spalte befindet.

[0.732703805, 0.233752429, 0.0335437432]

Im folgenden Code gibt die NumPy-Methode argmax die Spalte für jede Zeile zurück, die den höchsten Wert enthält. Der höchste Wert entspricht der Vorhersage, die am wahrscheinlichsten richtig ist. In der zweiten Zeile wird das Array der Vorhersagen angezeigt.

# Get the prediction for each set of input data.
species_predictions = np.argmax(predictions.predictions, axis=1)

# View the best prediction for the penguin characteristics in each row.
species_predictions

Jedes Ergebnis im Array species_predictions sagt vorher, welcher Pinguinart die Werte in der entsprechenden Zeile mit Testdaten entsprechen. Der erste Wert ist beispielsweise 0, der der Spezifikation Adeliepinguin (Pygoscelis adeliae) zugeordnet ist. Das bedeutet, dass Ihr Modell vorhersagt, dass die Art eines Pinguins mit den Merkmalen in der ersten Zeile Ihrer Testdaten der Adeliepinguin (Pygoscelis adeliae) ist .

Ressourcen bereinigen

Nachdem Sie nun fertig sind, können Sie Ihr Notebook weiter verwenden, um die von Ihnen erstellten Ressourcen zu entdecken und mehr über ihre Funktionsweise zu erfahren.

Ressourcen löschen

Wenn Sie bereit sind, empfehlen wir Ihnen, die Google Cloud-Ressourcen zu löschen, die Sie in dieser Anleitung erstellt haben, damit keine unnötigen Kosten anfallen. Es gibt zwei Möglichkeiten, Ihre Ressourcen zu löschen:

  • Löschen Sie Ihr Projekt, wodurch auch alle mit Ihrem Projekt verknüpften Ressourcen gelöscht werden. Weitere Informationen zu Projekte beenden.

  • Code ausführen, der Ihren Trainingsjob (ein CustomTrainingJob-Objekt), Ihr Modell (ein Model-Objekt), Endpunkt (ein Endpoint-Objekt) und Cloud Storage-Bucket löscht. Mit dieser Option werden Ihr Projekt und alle anderen von Ihnen erstellten Ressourcen beibehalten, die Sie nicht explizit mit Ihrem Code löschen.

    Sie müssen die Bereitstellung des Modells aufheben, bevor Sie es löschen können. Übergeben Sie dazu force=True an die Methode endpoint.delete.

    Führen Sie den folgenden Code in Ihrem Notebook aus, um Ihr Projekt beizubehalten und nur Ressourcen zu löschen, die Sie in dieser Anleitung erstellt haben:

import os

# Delete the training job
job.delete()

# Delete the endpoint and undeploy the model from it
endpoint.delete(force=True)

# Delete the model
model.delete()

# Delete the storage bucket and its contents
bucket.delete(force=True)

Vertex AI Workbench-Instanz löschen

Sie können Ihre Vertex AI Workbench-Instanz für zukünftige Aufgaben behalten. Wenn Sie sie behalten, sollten Sie sich über die Kosten im Klaren sein. Weitere Informationen finden Sie unter Vertex AI Workbench-Preise.

Wenn Sie die Vertex AI Workbench-Instanz löschen möchten, gehen Sie so vor:

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI Workbench-Instanzen auf.

    Zur Seite „VM-Instanzen“

  2. Wählen Sie die Vertex AI Workbench-Instanz aus.

  3. Klicken Sie im oberen Menü auf  Löschen.

  4. Klicken Sie im Bestätigungsdialogfeld Instanz löschen auf Bestätigen. Es dauert einige Minuten, bis der Löschvorgang abgeschlossen ist.