Hello 커스텀 학습: 커스텀 이미지 분류 모델 학습

이 페이지에서는 Vertex AI에서 TensorFlow Keras 학습 애플리케이션을 실행하는 방법을 보여줍니다. 이 특정 모델은 유형별로 꽃을 분류할 수 있는 이미지 분류 모델을 학습시킵니다.

이 튜토리얼은 여러 페이지로 이루어져 있습니다.

  1. 프로젝트 및 환경 설정

  2. 커스텀 이미지 분류 모델 학습

  3. 커스텀 이미지 분류 모델을 사용한 예측 제공

  4. 프로젝트 삭제

각 페이지에서는 이 튜토리얼의 이전 페이지에서 안내를 이미 수행했다고 가정합니다.

이 문서의 나머지 부분에서는 이 튜토리얼의 첫 번째 페이지를 따를 때 만든 Cloud Shell 환경과 동일한 환경을 사용한다고 가정합니다. 기존 Cloud Shell 세션이 더 이상 열려 있지 않으면 다음을 수행하여 환경으로 돌아갈 수 있습니다.

  1. Google Cloud 콘솔에서 Cloud Shell을 활성화합니다.

    Cloud Shell 활성화

  2. Cloud Shell 세션에서 다음 명령어를 실행하세요.

    cd hello-custom-sample
    

커스텀 학습 파이프라인 실행

이 섹션에서는 Cloud Storage에 업로드한 학습 패키지를 사용하여 Vertex AI 커스텀 학습 파이프라인을 실행하는 방법을 설명합니다.

  1. Google Cloud Console의 Vertex AI 섹션에서 학습 파이프라인 페이지로 이동합니다.

    학습 파이프라인으로 이동

  2. 만들기를 클릭하여 새 모델 학습 창을 엽니다.

  3. 학습 방법 선택 단계에서 다음을 수행합니다.

    1. 데이터 세트 드롭다운 목록에서 관리형 데이터 세트 없음을 선택합니다. 이 특정 학습 애플리케이션은 관리형 Vertex AI 데이터 세트가 아닌 TensorFlow 데이터 세트 라이브러리에서 데이터를 로드합니다.

    2. 커스텀 학습(고급)이 선택되어 있는지 확인합니다.

    계속을 클릭합니다.

  4. 모델 세부정보 단계의 이름 필드에 hello_custom을 입력합니다. 계속을 클릭합니다.

  5. 학습 컨테이너 단계에서 Cloud Storage에 업로드한 학습 패키지를 사용하는 데 필요한 정보를 Vertex AI를 제공합니다.

    1. 사전 빌드된 컨테이너를 선택합니다.

    2. 모델 프레임워크 드롭다운 목록에서 TensorFlow를 선택합니다.

    3. 모델 프레임워크 버전 드롭다운 목록에서 2.3을 선택합니다.

    4. 패키지 위치 필드에 cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz를 입력합니다.

    5. Python 모듈 필드에 trainer.task를 입력합니다. trainer는 tarball에 있는 Python 패키지의 이름이고 task.py에는 학습 코드가 포함됩니다. 따라서 trainer.task는 Vertex AI가 실행하려는 모듈의 이름입니다.

    6. 모델 출력 디렉터리 필드에서 찾아보기를 클릭합니다. 폴더 선택 창에서 다음을 수행합니다.

      1. Cloud Storage 버킷으로 이동합니다.

      2. 새 폴더 만들기 를 클릭합니다.

      3. 새 폴더 이름을 output로 지정합니다. 그런 다음 만들기를 클릭합니다.

      4. 선택을 클릭합니다.

      필드 값이 gs://BUCKET_NAME/output인지 확인합니다. 여기서 BUCKET_NAME은 Cloud Storage 버킷의 이름입니다.

      이 값은 baseOutputDirectory API 필드의 Vertex AI로 전달되어 학습 애플리케이션이 실행되면 액세스할 수 있는 여러 환경 변수를 설정합니다.

      예를 들어 이 필드를 gs://BUCKET_NAME/output으로 설정하면 Vertex AI가 AIP_MODEL_DIR 환경 변수를 gs://BUCKET_NAME/output/model로 설정합니다. 학습이 끝나면 Vertex AI가 AIP_MODEL_DIR 디렉터리의 모든 아티팩트를 사용하여 모델 리소스를 만듭니다.

      이 필드에서 설정한 환경 변수 자세히 알아보기

    계속을 클릭합니다.

  6. 선택적 초매개변수 단계에서 초매개변수 조정 사용 설정 체크박스가 해제되어 있는지 확인합니다. 이 튜토리얼에서는 초매개변수 조정을 사용하지 않습니다. 계속을 클릭합니다.

  7. 컴퓨팅 및 가격 책정 단계에서 커스텀 학습 작업에 리소스를 할당합니다.

    1. 리전 드롭다운 목록에서 us-central1(아이오와)을 선택합니다.

    2. 머신 유형 드롭다운 목록의 표준 섹션에서 n1-standard-4를 선택합니다.

    이 튜토리얼에 가속기 또는 작업자 풀을 추가하지 마세요. 계속을 클릭합니다.

  8. 예측 컨테이너 단계에서 Vertex AI에 예측을 제공하는 데 필요한 정보를 제공합니다.

    1. 사전 빌드된 컨테이너를 선택합니다.

    2. 사전 빌드된 컨테이너 설정 섹션에서 다음을 수행합니다.

      1. 모델 프레임워크 드롭다운 목록에서 TensorFlow를 선택합니다.

      2. 모델 프레임워크 버전 드롭다운 목록에서 2.3을 선택합니다.

      3. 가속기 유형 드롭다운 목록에서 없음을 선택합니다.

      4. 모델 디렉터리 필드의 값이 gs://BUCKET_NAME/output인지 확인합니다. 여기서 BUCKET_NAME은 Cloud Storage 버킷의 이름입니다. 이는 이전 단계에서 제공한 모델 출력 디렉터리 값과 일치합니다.

    3. 스키마 예측 섹션의 필드는 비워 둡니다.

  9. 학습 시작을 클릭하여 커스텀 학습 파이프라인을 시작합니다.

이제 학습 페이지에서 이름이 hello_custom인 새 학습 파이프라인을 볼 수 있습니다. 페이지를 새로 고쳐야 할 수도 있습니다. 학습 파이프라인은 다음 두 가지 주요 작업을 수행합니다.

  1. 학습 파이프라인은 hello_custom-custom-job이라는 커스텀 작업 리소스를 만듭니다. 잠시 후 학습 섹션의 커스텀 작업 페이지에서 이 리소스를 볼 수 있습니다.

    커스텀 작업으로 이동

    커스텀 작업은 이 섹션에서 지정한 컴퓨팅 리소스를 사용하여 학습 애플리케이션을 실행합니다.

  2. 커스텀 작업이 완료되면 학습 파이프라인은 학습 애플리케이션이 Cloud Storage 버킷의 output/model/ 디렉터리에서 생성하는 아티팩트를 찾습니다. 이 아티팩트를 사용하여 모델 리소스를 만듭니다.

학습 모니터링

로그를 보려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔의 Vertex AI 섹션에서 커스텀 작업 페이지로 이동합니다.

    커스텀 작업으로 이동

  2. 방금 만든 CustomJob의 세부정보를 보려면 목록에서 hello_custom-custom-job을 클릭합니다.

  3. 작업 세부정보 페이지에서 로그 보기를 클릭합니다.

학습된 모델 보기

커스텀 학습 파이프라인이 완료되면 Google Cloud Console의 Vertex AI 섹션에서 모델 페이지로 이동하여 학습된 모델을 찾을 수 있습니다.

모델로 이동

모델 이름은 hello_custom입니다.

다음 단계

이 튜토리얼의 다음 페이지에 따라 학습된 ML 모델에서 예측을 제공합니다.