Introduzione ai dati di testo: configura il progetto e l'ambiente

Se prevedi di utilizzare l'SDK Vertex AI per Python, assicurati che l'account di servizio che inizializza il client abbia il ruolo IAM Agente di servizio Vertex AI (roles/aiplatform.serviceAgent).

Per questa parte del tutorial, configurerai il progetto Google Cloud per utilizzare Vertex AI e un bucket Cloud Storage contenente i documenti per l'addestramento del modello AutoML.

Questo tutorial è composto da diverse pagine:

  1. Configurazione del progetto e dell'ambiente.

  2. Creazione di un set di dati per la classificazione del testo .

  3. Addestramento di un modello di classificazione di testo AutoML.

  4. Esegui il deployment del modello su un endpoint e invia una previsione.

  5. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni dalle pagine precedenti del tutorial.

Configurazione del progetto e dell'ambiente

Completa i seguenti passaggi prima di utilizzare la funzionalità Vertex AI.

  1. Nella console Google Cloud, vai alla pagina del selettore progetto.

    Vai al selettore progetti

  2. Seleziona o crea un progetto Google Cloud.

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. Apri Cloud Shell. Cloud Shell è un ambiente shell interattivo per Google Cloud che consente di gestire progetti e risorse dal browser web.
  5. Vai a Cloud Shell
  6. In Cloud Shell, imposta il progetto corrente sul tuo ID progetto Google Cloud e archivialo nella variabile shell projectid:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Sostituisci PROJECT_ID con l'ID progetto. Puoi trovare il tuo ID progetto nella console Google Cloud. Per maggiori informazioni, consulta Trovare l'ID progetto.
  7. Abilita le API IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI.

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Concedi i ruoli al tuo Account Google. Esegui questo comando una volta per ciascuno dei seguenti ruoli IAM: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • Sostituisci PROJECT_ID con l'ID progetto.
    • Sostituisci EMAIL_ADDRESS con il tuo indirizzo email.
    • Sostituisci ROLE con ogni singolo ruolo.
  9. Il ruolo IAM Utente Vertex AI (roles/aiplatform.user) fornisce l'accesso per utilizzare tutte le risorse in Vertex AI. Storage Admin (roles/storage.admin) ti consente di archiviare il set di dati di addestramento del documento in Cloud Storage.

crea un bucket Cloud Storage e copia il set di dati di esempio

Crea un bucket Cloud Storage per archiviare i documenti utilizzati per addestrare il modello AutoML.

  1. Apri Cloud Shell.

  2. Imposta la variabile PROJECT_ID sull'ID del progetto.

    export PROJECT_ID=PROJECT_ID
  3. Imposta la variabile BUCKET, che utilizzi per creare un bucket Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Crea un bucket Cloud Storage nella regione us-central1 con la variabile BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Copia il set di dati di addestramento di esempio happiness.csv nel tuo bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Passaggi successivi

Segui la pagina successiva di questo tutorial per utilizzare la console Vertex AI per creare un set di dati di classificazione del testo e importare i documenti copiati nel bucket Cloud Storage.