Introduzione ai dati di testo: crea un set di dati per la classificazione del testo e importa i documenti

Utilizza la console Vertex AI per creare un set di dati di classificazione del testo. Dopo aver creato il set di dati, utilizza il file CSV che hai copiato nel bucket Cloud Storage per importare questi documenti nel set di dati.

Questo tutorial è composto da diverse pagine:

  1. Configura il progetto e l'ambiente.

  2. Creazione di un set di dati di classificazione del testo .

  3. Addestramento di un modello di classificazione di testo AutoML.

  4. Esegui il deployment del modello su un endpoint e invia una previsione.

  5. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni dalle pagine precedenti del tutorial.

  1. Vai alla console Vertex AI.

  2. Nella pagina Inizia a utilizzare Vertex AI, fai clic su Crea set di dati.

  3. Specifica i dettagli del set di dati.

    1. Specifica un nome per questo set di dati, ad esempio text_classification_tutorial.

    2. Nella sezione Seleziona un tipo di dati e un obiettivo, fai clic su Testo e poi seleziona Classificazione del testo (etichetta singola).

    3. In Regione, seleziona us-central1.

      Questo tutorial utilizza us-central1, ma Vertex AI supporta altre regioni, come europe-west4.

    4. Fai clic su Crea per creare il set di dati vuoto e quindi importare i documenti.

  4. Nella pagina di importazione, seleziona Seleziona file di importazione da Cloud Storage e specifica il percorso del file CSV in Cloud Storage. Suggerimento: fai clic su Sfoglia, seleziona il file happiness.csv nella finestra di dialogo Seleziona oggetto e fai clic su Seleziona.

    Per questo tutorial, il file CSV si trova all'indirizzo: gs://${BUCKET}/text/happiness.csv. Il bucket per questo tutorial si trova nella stessa regione del set di dati, ma puoi specificare file che si trovano in bucket da qualsiasi regione.

  5. Mantieni la suddivisione dati predefinita.

    Vertex AI assegna automaticamente documenti ai set di addestramento, convalida e test. Per maggiori informazioni, consulta Informazioni sulle suddivisioni dei dati per i modelli AutoML.

  6. Fai clic su Continua per avviare l'importazione.

    Il processo di importazione richiederà alcuni minuti. Al termine dell'importazione, puoi sfogliare tutti i documenti importati e le relative etichette associate nella scheda Sfoglia del set di dati.

Passaggi successivi

Segui la pagina successiva di questo tutorial per avviare un job di addestramento del modello AutoML.