Hello 텍스트 데이터: 텍스트 분류 데이터 세트 만들기 및 문서 가져오기

Vertex AI 콘솔을 사용하여 텍스트 분류 데이터 세트를 만듭니다. 데이터 세트가 생성된 후 Cloud Storage 버킷으로 복사한 CSV를 사용하여 해당 문서를 데이터 세트로 가져옵니다.

이 튜토리얼은 여러 페이지로 이루어져 있습니다.

각 페이지에서는 이 튜토리얼의 이전 페이지에서 안내를 이미 수행했다고 가정합니다.

Vertex AI 콘솔로 이동합니다.
Vertex AI 시작하기 페이지에서 데이터 세트 만들기를 클릭합니다.
데이터 세트에 대한 세부정보를 지정합니다.
1. 데이터 세트 이름을 지정합니다(예: text_classification_tutorial).
2. 데이터 유형 및 목표 선택 섹션에서 텍스트를 클릭한 후 텍스트 분류(단일 라벨)를 선택합니다.
3. 리전으로 us-central1을 선택합니다.
  
  이 튜토리얼에서는 us-central1을 사용하지만 Vertex AI는 europe-west4와 같은 다른 리전을 지원합니다.
4. 만들기를 클릭하여 빈 데이터 세트를 만든 후 문서를 가져옵니다.
가져오기 페이지에서 Cloud Storage에서 가져오기 파일 선택을 선택하고 CSV 파일의 Cloud Storage 위치를 지정합니다. 팁: 둘러보기를 클릭하고 객체 선택 대화상자에서 happiness.csv 파일을 선택한 후 선택을 클릭합니다.

이 튜토리얼에서 CSV 파일은 gs://${BUCKET}/text/happiness.csv에 있습니다. 이 튜토리얼의 버킷은 데이터 세트와 동일한 리전에 있지만 모든 리전의 버킷에 있는 파일을 지정할 수 있습니다.
기본 데이터 분할을 유지합니다.

Vertex AI는 학습, 검증, 테스트 세트에 문서를 자동으로 할당합니다. 자세한 내용은 AutoML 모델의 데이터 분할 정보를 참조하세요.
계속을 클릭하여 가져오기를 시작합니다.

가져오기 프로세스는 몇 분 정도 걸립니다. 가져오기가 완료되면 데이터 세트의 찾아보기 탭에서 가져온 모든 문서와 관련 라벨을 탐색할 수 있습니다.

다음 단계

이 튜토리얼의 다음 페이지를 따라 AutoML 모델 학습 작업을 시작합니다.

프로젝트 및 환경 설정

AutoML 텍스트 분류 모델 학습