Vorhersagen treffen

Sie können nun die Testdaten in df_for_prediction verwenden, um eine Vorhersageanfrage zu stellen. Die Vorhersageanfrage ruft Ihr Modell auf, um vorherzusagen, welche Pinguinart durch die Pinguinmerkmale in jeder Zeile in df_for_prediction repräsentiert wird.

Testdaten für die Vorhersage vorbereiten

Bevor Sie die Testdaten zum Erstellen von Vorhersagen verwenden können, entfernen Sie die Spalte species. Da die Pinguinarten den von Ihnen vorhergesagten Daten entsprechen, können sie nicht in die Testdaten aufgenommen werden, die zum Erstellen einer Vorhersage verwendet werden. Nachdem Sie die Spalte species entfernt haben, konvertieren Sie die Daten in eine Python-Liste, da die Methode predict dies als Eingabe erwartet. Führen Sie den folgenden Code aus, um Ihre Daten in eine Python-Liste zu konvertieren:

# Remove the species column
df_for_prediction.pop(LABEL_COLUMN)

# Convert data to a Python list
test_data_list = df_for_prediction.values.tolist()

(Optional) Testdaten ansehen

Um die Testdaten besser zu verstehen, führen Sie die folgende Codezeile aus, damit Sie sie ansehen können:

test_data_list

In jeder Zeile beziehen sich die jeweiligen Werte in den sechs Spalten auf die folgenden Merkmale eines Pinguins:

Spalte Pinguinmerkmal
0 island: Die Insel, auf der eine Pinguinart vorkommt. Die Wertzuordnung der Insel ist 0 für Dream, 1 für Biscoe und 2 für Torgersen.
1 culmen_length_mm: Die Länge des Rückens entlang der Schnabeloberseite eines Pinguins.
2 culmen_depth_mm: Die Höhe des Schnabels eines Pinguins.
3 flipper_length_mm: Die Länge des flossenartigen Flügels eines Pinguins.
4 body_mass_g: Die Körpermasse eines Pinguins.
5 sex – Das Geschlecht des Pinguins. 0 ist FEMALE und 1 ist MALE.

Vorhersageanfrage senden

Um eine Vorhersageanfrage zu erstellen, übergeben Sie die von Ihnen erstellte Python-Liste mit Testdaten an die Methode predict von endpoint.

Die predict-Methode wertet die Merkmale in jeder Zeile aus und verwendet sie, um vorherzusagen, welche Pinguinart sie darstellen. Führen Sie den folgenden Code aus, um Ihre Vorhersagen zu erstellen. Die zurückgegebenen Vorhersagen enthalten eine Liste von Zeilen, wobei jede Zeile drei Spalten hat (Adeliepinguin (Pygoscelis adeliae) (Spalte 1),Zügelpinguin (Pygoscelis antarctica) (Spalte 2) oder Eselspinguin (Pygoscelis papua) (Spalte 3)).

# Get your predictions.
predictions = endpoint.predict(instances=test_data_list)

# View the predictions
predictions.predictions

Jede Spalte in einer Zeile enthält einen Wert. Je höher der Wert, desto größer ist die Wahrscheinlichkeit, dass die durch diese Spalte dargestellte Pinguinart eine korrekte Vorhersage ist. In der folgenden Beispiel-Ausgabezeile für die Vorhersage verwendet das Modell die Merkmale der Beispiel-Pinguin-Datenzeile, um vorherzusagen, dass es sich bei dem Pinguin höchstwahrscheinlich um die Art Adeliepinguin (Pygoscelis adeliae) handelt. Das liegt daran, dass sich der höchste Wert 0.732703805 in der ersten Spalte befindet.

[0.732703805, 0.233752429, 0.0335437432]

Im folgenden Code gibt die NumPy-Methode argmax die Spalte für jede Zeile zurück, die den höchsten Wert enthält. Der höchste Wert entspricht der Vorhersage, die am wahrscheinlichsten richtig ist. In der zweiten Zeile wird das Array der Vorhersagen angezeigt.

# Get the prediction for each set of input data.
species_predictions = np.argmax(predictions.predictions, axis=1)

# View the best prediction for the penguin characteristics in each row.
species_predictions

Mit jedem Ergebnis im species_predictions-Array wird vorhergesagt, welcher Pinguinart die Werte in der entsprechenden Zeile der Testdaten entsprechen. Der erste Wert ist beispielsweise 0, der der Spezifikation Adeliepinguin (Pygoscelis adeliae) zugeordnet ist. Das bedeutet, dass Ihr Modell vorhersagt, dass die Art eines Pinguins mit den Merkmalen in der ersten Zeile Ihrer Testdaten der Adeliepinguin (Pygoscelis adeliae) ist .

Ressourcen bereinigen

Nachdem Sie nun fertig sind, können Sie Ihr Notebook weiter verwenden, um die von Ihnen erstellten Ressourcen zu entdecken und mehr über ihre Funktionsweise zu erfahren.

Ressourcen löschen

Wenn Sie fertig sind, löschen Sie die Google Cloud-Ressourcen, die Sie in dieser Anleitung erstellt haben, damit keine unnötigen Kosten anfallen. Es gibt zwei Möglichkeiten, Ressourcen zu löschen:

  • Löschen Sie Ihr Projekt. Dadurch werden auch alle mit dem Projekt verknüpften Ressourcen gelöscht. Weitere Informationen zu Projekte beenden.

  • Code ausführen, der Ihren Trainingsjob (ein CustomTrainingJob-Objekt), Ihr Modell (ein Model-Objekt), Endpunkt (ein Endpoint-Objekt) und Cloud Storage-Bucket löscht. Bei dieser Option bleiben Ihr Projekt und alle anderen Ressourcen erhalten, die Sie möglicherweise erstellt haben und die nicht explizit mit Ihrem Code gelöscht werden.

    Sie müssen die Bereitstellung des Modells aufheben, bevor Sie es löschen können. Dazu übergeben Sie force=True an die Methode endpoint.delete.

    Führen Sie den folgenden Code in Ihrem Notebook aus, um Ihr Projekt beizubehalten und nur Ressourcen zu löschen, die Sie in dieser Anleitung erstellt haben:

import os

# Delete the training job
job.delete()

# Delete the endpoint and undeploy the model from it
endpoint.delete(force=True)

# Delete the model
model.delete()

# Delete the storage bucket and its contents
bucket.delete(force=True)

Vertex AI Workbench-Instanz löschen

Sie können Ihre Vertex AI Workbench-Instanz für zukünftige Aufgaben behalten. Wenn Sie sie behalten, sollten Sie sich über die Kosten im Klaren sein. Weitere Informationen finden Sie unter Vertex AI Workbench-Preise.

Wenn Sie die Vertex AI Workbench-Instanz löschen möchten, gehen Sie so vor:

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI Workbench-Instanzen auf.

    Zur Seite „VM-Instanzen“

  2. Wählen Sie die Vertex AI Workbench-Instanz aus.

  3. Klicken Sie im oberen Menü auf  Löschen.

  4. Klicken Sie im Bestätigungsdialogfeld Instanz löschen auf Bestätigen. Es dauert einige Minuten, bis der Löschvorgang abgeschlossen ist.