Introduzione ai dati tabulari: crea un set di dati e addestra un modello di classificazione AutoML

Utilizza la console Google Cloud per creare un set di dati tabulare e addestrare un modello di classificazione.

Crea un set di dati tabulare

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Set di dati.

    Vai alla pagina Set di dati

  2. Fai clic su Crea nella barra dei pulsanti per creare un nuovo set di dati.

  3. Inserisci Structured_AutoML_Tutorial come nome del set di dati e seleziona la scheda Tabulare.

  4. Seleziona l'obiettivo Regressione/classificazione.

    Lascia il campo Regione impostato su us-central1.

  5. Fai clic su Crea per creare il set di dati.

    Per questo tutorial, utilizzerai un set di dati bancari disponibile pubblicamente e ospitato su Cloud Storage.

  6. In Seleziona un'origine dati, fai clic su Seleziona file CSV da Cloud Storage

  7. In Percorso file di importazione, inserisci cloud-ml-tables-data/bank-marketing.csv.

  8. Fai clic su Continua.

Analizza il set di dati

Nella sezione Analizza puoi visualizzare ulteriori informazioni sul set di dati, ad esempio i valori mancanti o NULL.

Poiché il nostro set di dati è formattato correttamente per questo tutorial, non devi fare nulla in questa pagina e puoi saltare questa sezione.

  1. (Facoltativo) Fai clic su Genera statistiche per visualizzare il numero di valori mancanti o NULL nel set di dati. Questa operazione può richiedere 10 minuti o più.

  2. (Facoltativo) Fai clic su una delle colonne delle funzionalità per saperne di più sui valori dei dati.

Addestra un modello di classificazione AutoML

  1. Fai clic su Addestra nuovo modello.

  2. Seleziona Altro.

  3. Nel riquadro Metodo di addestramento, verifica che il set di dati che hai creato in precedenza sia selezionato per il campo Set di dati.

  4. Nel campo Obiettivo, seleziona Classificazione.

  5. Verifica che sia selezionato il metodo di addestramento AutoML.

  6. Fai clic su Continua.

  7. Nel riquadro Dettagli modello, seleziona Deposito per la colonna di destinazione e fai clic su Continua.

    La colonna di destinazione è ciò che il modello deve prevedere quando viene addestrato. Per il set di dati bank-marketing.csv, la colonna Deposit indica se il cliente ha acquistato un deposito a termine (2 = sì, 1 = no).

    Il riquadro Opzioni di addestramento offre l'opportunità di aggiungere funzionalità e trasformare i dati delle colonne. Se non viene selezionata alcuna colonna, per impostazione predefinita tutte le colonne non target verranno utilizzate come funzionalità per l'addestramento. Questo set di dati è pronto per essere utilizzato, perciò non è necessario applicare alcuna trasformazione.

  8. Fai clic su Continua.

  9. Nel riquadro Calcolo e prezzi, inserisci 1 per il budget per l'addestramento.

    Il budget per l'addestramento determina il tempo effettivo per l'addestramento, ma il tempo per completare l'addestramento include altre attività, quindi l'intero processo può richiedere più di un'ora. Al termine dell'addestramento, il modello viene visualizzato nella scheda del modello come link attivo, con un segno di spunta verde.

  10. Fai clic su Inizia addestramento.

Passaggi successivi

Ha inizio l'addestramento del modello, il che può richiedere un'ora o più tempo. Riceverai un'email al termine dell'addestramento. Una volta completato l'addestramento del modello, segui la pagina successiva di questo tutorial per eseguire il deployment del modello e richiedere una previsione.

Questo tutorial utilizza un set di dati che è stato pulito e formattato per l'addestramento AutoML, ma la maggior parte dei dati richiederà un po' di lavoro prima di poter essere utilizzati. La qualità dei dati di addestramento influisce sull'efficacia dei modelli creati. Scopri di più sulla preparazione dei dati.

L'ottenimento dei dati e la loro preparazione sono fondamentali per garantire un modello di machine learning accurato. Scopri di più sulle best practice.

Scopri di più sulla creazione di un set di dati tabulare.

Vertex AI offre due metodi di addestramento dei modelli, AutoML e addestramento personalizzato. AutoML consente di eseguire l'addestramento con il minimo sforzo e di avere esperienza di machine learning, mentre l'addestramento personalizzato offre il controllo completo sulle funzionalità di addestramento. Scopri di più sui metodi di addestramento.

Vertex AI esamina il tipo di dati di origine e i valori delle caratteristiche e deduce come utilizzerà la caratteristica nell'addestramento del modello. Ti consigliamo di esaminare il tipo di dati di ogni colonna per verificare che sia stato interpretato correttamente. Se necessario, puoi specificare una trasformazione supportata diversa per qualsiasi funzionalità. Scopri di più sulle trasformazioni.

Scopri di più sull'addestramento di AutoML per la classificazione o la regressione.