Hello-Textdaten: Textklassifizierungs-Dataset erstellen und Dokumente importieren

Mit der Vertex-AI-Konsole ein Textklassifizierungs-Dataset erstellen Wenn das Dataset erstellt ist, verwenden Sie die CSV-Datei, die Sie in Ihren Cloud Storage-Bucket kopiert haben, um diese Dokumente in das Dataset zu importieren.

Diese Anleitung umfasst mehrere Seiten:

Projekt und Umgebung einrichten
Textklassifizierungs-Dataset erstellen
AutoML-Textklassifizierungsmodell trainieren.
Modell auf einem Endpunkt bereitstellen und eine Vorhersage treffen.
Projekt bereinigen.

Auf jeder Seite wird davon ausgegangen, dass Sie die Anleitung auf den vorherigen Seiten des Leitfadens bereits ausgeführt haben.

Rufen Sie die Vertex AI-Konsole auf.
Klicken Sie auf der Seite Erste Schritte mit Vertex AI auf Dataset erstellen.
Geben Sie Details zu Ihrem Dataset an.
1. Geben Sie einen Namen für dieses Dataset an, z. B. text_classification_tutorial.
2. Klicken Sie unter Datentyp und Ziel auswählen auf Text und wählen Sie dann Textklassifizierung (ein Label) aus.
3. Wählen Sie als Region us-central1 aus.
  
  In dieser Anleitung wird us-central1 verwendet, aber Vertex AI unterstützt auch andere Regionen, z. B. europe-west4.
4. Klicken Sie auf Erstellen, um das leere Dataset zu erstellen, und importieren Sie dann die Dokumente.
Wählen Sie auf der Importseite die Option Importdateien aus Cloud Storage auswählen aus und geben Sie den Cloud Storage-Speicherort Ihrer CSV-Datei an. Tipp: Klicken Sie auf Durchsuchen, wählen Sie im Dialogfeld Objekt auswählen die Datei happiness.csv aus und klicken Sie auf Auswählen.

Für diese Anleitung befindet sich die CSV-Datei in gs://${BUCKET}/text/happiness.csv. Der Bucket für diese Anleitung ist in derselben Region wie das Dataset enthalten. Sie können aber Dateien aus Buckets jeder Region angeben.
Behalten Sie die standardmäßige Datenaufteilung bei.

Vertex AI weist Dokumente automatisch Trainings-, Validierungs- und Test-Datasets zu. Weitere Informationen finden Sie unter Datenaufteilungen für AutoML-Modelle.
Klicken Sie auf Weiter, um den Import zu starten.

Der Importvorgang dauert ein paar Minuten. Wenn der Import abgeschlossen ist, können Sie nach allen importierten Dokumenten und den zugehörigen Labels im Tab Durchsuchen des Datasets suchen.

Nächste Schritte

Folgen Sie der nächsten Seite dieser Anleitung, um einen AutoML-Modelltrainingsjob zu starten.

Zurück

Projekt und Umgebung einrichten

Weiter

AutoML-Textklassifizierungsmodell trainieren