예측하기

이제 df_for_prediction의 테스트 데이터를 사용하여 예측 요청을 실행할 수 있습니다. 이 예측 요청은 모델을 호출하여 df_for_prediction의 각 행에 있는 펭귄 특성으로 표현된 펭귄의 종을 예측합니다.

예측 테스트 데이터 준비

테스트 데이터를 사용하여 예측을 만들려면 먼저 species 열을 삭제해야 합니다. 펭귄의 종을 예측해야 하므로 예측을 만드는 데 사용되는 테스트 데이터에 이 열을 포함해서는 안 됩니다. species 열을 삭제한 후 predict 메서드에서 입력으로 가져올 수 있도록 데이터를 Python 목록으로 변환합니다. 다음 코드를 실행하여 데이터를 Python 목록으로 변환합니다.

# Remove the species column
df_for_prediction.pop(LABEL_COLUMN)

# Convert data to a Python list
test_data_list = df_for_prediction.values.tolist()

(선택사항) 테스트 데이터 보기

다음 코드 줄을 실행하여 보면 테스트 데이터를 이해하는 데 도움이 됩니다.

test_data_list

각 행에서 6개의 각 열에 있는 값은 각각 한 펭귄의 다음 특성을 나타냅니다.

열	펭귄 특성
0	`island` - 펭귄의 종이 발견된 섬입니다. island 값 매핑은 `Dream`의 경우 `0`, `Biscoe`의 경우 `1`, `Torgersen`의 경우 `2`입니다.
1	`culmen_length_mm` - 펭귄 부리 위쪽으로 이어지는 융선의 길이입니다.
2	`culmen_depth_mm` - 펭귄 부리의 높이입니다.
3	`flipper_length_mm` - 지느러미처럼 생긴 펭귄 날개의 길이입니다.
4	`body_mass_g` - 펭귄의 체중입니다.
5	`sex` - 펭귄의 성별입니다. `0`은 `FEMALE`이고 `1`은 `MALE`입니다.

예측 요청 전송

예측 요청을 만들려면 생성한 테스트 데이터의 Python 목록을 endpoint의 predict 메서드에 전달합니다.

predict 메서드는 각 행의 특성을 평가하고 이를 사용하여 특성이 나타내는 펭귄의 종류를 예측합니다. 다음 코드를 실행하여 예측을 만듭니다. 반환된 예측에는 행 목록이 포함되며 각 행에는 3개의 열이 있습니다(아델리펭귄(Pygoscelis adeliae)(열 1), 턱끈펭귄(Pygoscelis antarctica)(열 2) 또는 젠투펭귄(Pygoscelis papua)(열 3)).

# Get your predictions.
predictions = endpoint.predict(instances=test_data_list)

# View the predictions
predictions.predictions

행의 각 열에는 값이 포함되고 값이 클수록 해당 열로 표시된 펭귄의 종이 올바른 예측이라는 신뢰도가 높아집니다. 예를 들어 다음 샘플 예측 출력 행에서 이 모델은 샘플 펭귄 데이터 행의 특성을 사용하여 펭귄이 아델리펭귄(Pygoscelis adeliae) 종일 가능성이 가장 높은 것으로 예측합니다. 가장 높은 값인 0.732703805가 첫 번째 열에 있기 때문입니다.

[0.732703805, 0.233752429, 0.0335437432]

다음 코드에서 NumPy argmax 메서드는 가장 높은 값이 포함된 각 행의 열을 반환합니다. 가장 높은 값이 올바를 가능성이 가장 높은 예측에 해당합니다. 두 번째 줄은 예측 배열을 표시합니다.

# Get the prediction for each set of input data.
species_predictions = np.argmax(predictions.predictions, axis=1)

# View the best prediction for the penguin characteristics in each row.
species_predictions

species_predictions 배열의 각 결과는 테스트 데이터의 해당 행에 있는 값이 해당하는 펭귄 종을 예측합니다. 예를 들어 첫 번째 값은 아델리펭귄(Pygoscelis adeliae) 종에 매핑되는 0입니다. 즉, 이 모델은 테스트 데이터의 첫 번째 행에 있는 특성을 가진 펭귄의 종이 아델리펭귄(Pygoscelis adeliae)이라고 예측합니다.

리소스 삭제

이제 계속해서 노트북을 사용하여 자신이 만든 리소스와 작동 방식을 자세히 알아볼 수 있습니다.

리소스 삭제

준비가 되면 불필요한 요금이 발생하지 않도록 이 튜토리얼에서 만든 Google Cloud 리소스를 삭제하는 것이 좋습니다. 리소스를 삭제하는 방법에는 두 가지가 있습니다.

프로젝트를 삭제합니다. 그러면 프로젝트와 연결된 모든 리소스도 삭제됩니다. 자세한 내용은 프로젝트 종료(삭제)를 참조하세요.
학습 작업(CustomTrainingJob 객체), 모델(Model 객체), 엔드포인트(Endpoint 객체), Cloud Storage 버킷을 삭제하는 코드를 실행합니다. 이 옵션을 사용하면 프로젝트와 코드에서 명시적으로 삭제하지 않은 내가 만든 리소스가 유지됩니다.

삭제하기 전에 force=True를 endpoint.delete 메서드에 전달하여 모델의 배포를 취소해야 합니다.

프로젝트는 유지하고 이 튜토리얼에서 만든 리소스만 삭제하려면 노트북에서 다음 코드를 실행합니다.

import os

# Delete the training job
job.delete()

# Delete the endpoint and undeploy the model from it
endpoint.delete(force=True)

# Delete the model
model.delete()

# Delete the storage bucket and its contents
bucket.delete(force=True)

Vertex AI Workbench 인스턴스 삭제

이후 작업에 사용하도록 Vertex AI Workbench 인스턴스를 유지할 수 있습니다. 그대로 유지하는 경우 비용에 관해 알고 있어야 합니다. 자세한 내용은 Vertex AI Workbench 가격 책정을 참조하세요.

Vertex AI Workbench 인스턴스를 삭제하려면 다음을 수행합니다.

Google Cloud 콘솔에서 Vertex AI Workbench 인스턴스 페이지로 이동합니다.

인스턴스로 이동
Vertex AI Workbench 인스턴스를 선택합니다.
상단 메뉴에서 삭제를 클릭합니다.
인스턴스 삭제 확인 대화상자에서 확인을 클릭합니다. 삭제를 완료하는 데 몇 분 정도 걸립니다.

모델 학습