이 튜토리얼은 Python용 Vertex AI SDK를 사용하여 커스텀 학습 모델을 만드는 방법을 처음부터 끝까지 보여주는 가이드입니다. Docker 컨테이너를 사용하여 모델을 학습시키고 만드는 JupyterLab 노트북에서 코드를 실행합니다. 이 튜토리얼은 Vertex AI를 처음 접하며 노트북, Python, 머신러닝(ML) 워크플로에 익숙한 데이터 과학자를 대상으로 합니다.
이 프로세스에서는 먼저 Google Cloud 콘솔을 사용하여 작업이 포함된 프로젝트를 만듭니다. 프로젝트에서 Vertex AI Workbench를 사용하여 JupyterLab 노트북을 만듭니다. 노트북 환경에서 데이터 세트를 다운로드하고 준비하는 코드를 실행한 다음 데이터 세트를 사용하여 모델을 만들고 학습시킵니다. 튜토리얼이 끝나면 학습된 모델에서 예측을 생성합니다.
이 튜토리얼의 목표는 1시간 이내에 예측을 만드는 데 필요한 모든 단계를 안내하는 것입니다. 사용되는 데이터 세트가 비교적 작으므로 모델을 학습시키는 데 시간이 오래 걸리지 않습니다. 튜토리얼을 완료한 후 학습한 내용을 더 큰 데이터 세트에 적용하면 됩니다. 데이터 세트가 클수록 예측이 더 정확해집니다.
튜토리얼 단계
기본 요건 - Google Cloud 계정 및 프로젝트를 만듭니다.
노트북 만들기 - JupyterLab 노트북 및 환경을 만들고 준비합니다. 노트북을 사용하여 데이터 세트를 만들고, 모델을 만들고 학습시키고, 예측을 생성하는 코드를 실행합니다.
데이터 세트 만들기 - 공개적으로 사용 가능한 BigQuery 데이터 세트를 다운로드한 다음 이를 사용하여 Vertex AI 테이블 형식 데이터 세트를 만듭니다. 데이터 세트에는 모델을 학습시키는 데 사용하는 데이터가 포함되어 있습니다.
학습 스크립트 만들기 - 학습 작업에 전달할 Python 스크립트를 만듭니다. 학습 작업이 모델을 학습시키고 만들 때 이 스크립트가 실행됩니다.
모델 학습 - 테이블 형식 데이터 세트를 사용하여 모델을 학습시키고 배포합니다. 모델을 이용해 예측을 만듭니다.
예측하기 - 모델을 사용하여 예측을 만듭니다. 이 섹션에서는 불필요한 요금이 발생하지 않도록 이 튜토리얼을 실행하는 동안 만든 리소스를 삭제하는 방법도 안내합니다.
학습 내용
이 튜토리얼에서는 Python용 Vertex AI SDK를 사용하여 다음을 수행하는 방법을 설명합니다.
- 데이터 세트를 저장할 Cloud Storage 버킷 만들기
- 학습용 데이터 사전 처리
- 처리된 데이터를 사용하여 BigQuery에서 데이터 세트 만들기
- BigQuery 데이터 세트를 사용하여 Vertex AI 테이블 형식 데이터 세트 만들기
- 커스텀 학습 모델을 만들고 학습시키기
- 엔드포인트에 커스텀 학습 모델 배포
- 예측 생성
- 모델 배포 취소
- 추가 요금이 발생하지 않도록 튜토리얼에서 만든 모든 리소스 삭제하기
사용되는 청구 가능한 리소스
이 튜토리얼에서는 Vertex AI, BigQuery, Cloud Storage Google Cloud 서비스와 관련된 청구 가능한 리소스를 사용합니다. Google Cloud를 처음 사용하는 경우 이러한 서비스 중 하나 이상을 무료로 사용할 수 있습니다. Vertex AI는 신규 고객에게 $300의 무료 크레딧을 제공하며 Cloud Storage와 BigQuery에는 무료 등급이 있습니다. 자세한 내용은 다음을 참조하세요.
- Vertex AI 가격 책정 및 무료 클라우드 기능 및 무료 체험 혜택
- BigQuery 가격 책정 및 BigQuery 무료 등급 사용량
- Cloud Storage 가격 책정 및 Cloud Storage 무료 등급 사용량
- Google Cloud 가격 계산기
추가 요금이 부과되지 않도록 튜토리얼의 마지막 단계에서 자신이 만든 청구 가능한 모든 Google Cloud 리소스를 삭제하는 방법을 안내합니다.