Datos de texto de Hello: creación de un conjunto de datos de clasificación de texto e importación de documentos

Usa la consola de Vertex AI para crear un conjunto de datos de clasificación de texto. Después de crear tu conjunto de datos, usa el archivo CSV que copiaste en tu bucket de Cloud Storage para importar esos documentos al conjunto de datos.

En este instructivo, se incluyen las siguientes páginas:

  1. Configura tu proyecto y tu entorno

  2. Crea un conjunto de datos de clasificación de texto

  3. Entrena un modelo de clasificación de texto de AutoML.

  4. Implementa el modelo en un extremo y realiza una predicción.

  5. Limpia tu proyecto.

En cada página, se supone que ya realizaste las instrucciones de las páginas anteriores del instructivo.

  1. Ve a la consola de Vertex AI.

  2. En la página Get started with Vertex AI, haz clic en Create dataset.

  3. Especifica los detalles de tu conjunto de datos.

    1. Especifica un nombre para este conjunto de datos, como text_classification_tutorial.

    2. En la sección Selecciona un tipo de datos y un objetivo, haz clic en Texto y, luego, selecciona Clasificación de texto (una etiqueta).

    3. En Región, selecciona us-central1.

      En este instructivo, se usa us-central1, pero Vertex AI admite otras regiones, como europe-west4.

    4. Haz clic en Create para crear el conjunto de datos vacío y, luego, importar documentos.

  4. En la página de importación, elige Selecciona un archivo de importación de Cloud Storage y especifica la ubicación de Cloud Storage de tu archivo CSV. Sugerencia: Haz clic en Explorar, selecciona el archivo happiness.csv en el cuadro de diálogo Seleccionar objeto y haz clic en Seleccionar.

    Para este instructivo, el archivo CSV se encuentra en la siguiente ubicación: gs://${BUCKET}/text/happiness.csv. El bucket de este instructivo está en la misma región que el conjunto de datos, pero puedes especificar archivos que se encuentren en buckets de cualquier región.

  5. Mantén la división de datos predeterminada.

    Vertex AI asigna de forma automática los documentos a los conjuntos de entrenamiento, validación y prueba. Para obtener más información, consulta Acerca de las divisiones de datos para los modelos de AutoML.

  6. Haz clic en Continue para comenzar la importación.

    Este proceso de importación tardará algunos minutos. Cuando se completa la importación, puedes explorar todos los documentos importados y sus etiquetas asociadas en la pestaña Explorar del conjunto de datos.

¿Qué sigue?

Sigue las indicaciones de la siguiente página de este instructivo para iniciar un trabajo de entrenamiento de modelos de AutoML.