Gemini 비전 모델로 이미지 분석

이 튜토리얼에서는 Vertex AI gemini-1.0-pro-vision 모델을 기반으로 하는 BigQuery ML 원격 모델을 만드는 방법과 ML.GENERATE_TEXT 함수가 있는 모델을 사용하여 영화 포스터 이미지 세트를 분석하는 방법을 보여줍니다.

이 튜토리얼에서는 다음 태스크를 다룹니다.

Cloud Storage 버킷의 이미지 데이터에 대해 BigQuery 객체 테이블 생성하기
Vertex AI gemini-1.0-pro-vision 모델을 타겟팅하는 BigQuery ML 원격 모델을 만듭니다(미리보기).
ML.GENERATE_TEXT 함수와 함께 원격 모델을 사용하여 영화 포스터 모음과 연결된 영화를 식별합니다.

영화 포스터 데이터는 공개 Cloud Storage 버킷 gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters에서 사용할 수 있습니다.

필요한 역할

연결을 만들려면 BigQuery 연결 관리자(roles/bigquery.connectionAdmin) 역할이 필요합니다.
연결의 서비스 계정에 권한을 부여하려면 프로젝트 IAM 관리자(roles/resourcemanager.projectIamAdmin) 역할이 필요합니다.
데이터 세트, 모델, 테이블을 만들려면 BigQuery 데이터 편집자(roles/bigquery.dataEditor) 역할이 필요합니다.
BigQuery 작업을 실행하려면 BigQuery 사용자(roles/bigquery.user) 역할이 필요합니다.

비용

이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.

BigQuery ML: You incur costs for the data that you process in BigQuery.
Vertex AI: You incur costs for calls to the Vertex AI model that is represented by the BigQuery remote model.

프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요. Google Cloud를 처음 사용하는 사용자는 무료 체험판을 사용할 수 있습니다.

BigQuery 가격 책정에 대한 자세한 내용은 BigQuery 문서에서 BigQuery 가격 책정을 참조하세요.

Vertex AI 생성형 AI 가격 책정에 대한 자세한 내용은 Vertex AI 가격 책정 페이지를 참조하세요.

시작하기 전에

Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

참고: 이 절차에서 생성한 리소스를 유지하지 않으려면 기존 프로젝트를 선택하지 말고 프로젝트를 새로 만드세요. 작업이 끝나면 프로젝트를 삭제하여 프로젝트와 관련된 모든 리소스를 삭제할 수 있습니다.

프로젝트 선택기로 이동
Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.
API BigQuery, BigQuery Connection, and Vertex AI 사용 설정
API 사용 설정

데이터 세트 생성

ML 모델을 저장할 BigQuery 데이터 세트를 만듭니다.

Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

BigQuery 페이지로 이동
탐색기 창에서 프로젝트 이름을 클릭합니다.
작업 보기 > 데이터 세트 만들기를 클릭합니다.
데이터 세트 만들기 페이지에서 다음을 수행합니다.
- 데이터 세트 ID에 bqml_tutorial를 입력합니다.
- 위치 유형에 대해 멀티 리전을 선택한 다음 US(미국 내 여러 리전)를 선택합니다.
  
  공개 데이터 세트는 US 멀티 리전에 저장됩니다. 편의상 같은 위치에 데이터 세트를 저장합니다.
- 나머지 기본 설정은 그대로 두고 데이터 세트 만들기를 클릭합니다.

연결 만들기

클라우드 리소스 연결을 만들고 연결의 서비스 계정을 가져옵니다.

콘솔

BigQuery 페이지로 이동합니다.

BigQuery로 이동
연결을 만들려면 추가를 클릭한 다음 외부 데이터 소스에 연결을 클릭합니다.
연결 유형 목록에서 Vertex AI 원격 모델, 원격 함수, BigLake(Cloud 리소스)를 선택합니다.
연결 ID 필드에 tutorial을 입력합니다.
연결 만들기를 클릭합니다.
연결로 이동을 클릭합니다.
이후 단계에서 사용할 수 있도록 연결 정보 창에서 서비스 계정 ID를 복사합니다.

bq

명령줄 환경에서 연결을 만듭니다.
```
bq mk --connection --location=us --project_id=PROJECT_ID \
    --connection_type=CLOUD_RESOURCE tutorial
```
--project_id 매개변수는 기본 프로젝트를 재정의합니다.

PROJECT_ID를 Google Cloud 프로젝트 ID로 바꿉니다.

연결 리소스를 만들면 BigQuery가 고유한 시스템 서비스 계정을 만들고 이를 연결에 연계합니다.

문제 해결: 다음 연결 오류가 발생하면 Google Cloud SDK를 업데이트하세요.
```
Flags parsing error: flag --connection_type=CLOUD_RESOURCE: value should be one of...
```

이후 단계에서 사용할 수 있도록 서비스 계정 ID를 가져와 복사합니다.

bq show --connection PROJECT_ID.us.tutorial

출력은 다음과 비슷합니다.

name                properties
1234.us.tutorial    {"serviceAccountId": "connection-1234-9u56h9@gcp-sa-bigquery-condel.iam.gserviceaccount.com"}

Terraform

main.tf 파일에 다음 섹션을 추가합니다.

 ## This creates a Cloud Resource connection.
 ## Note: The cloud resource nested object has only one output only field - serviceAccountId.
 resource "google_bigquery_connection" "connection" {
    connection_id = "tutorial"
    project = "PROJECT_ID"
    location = "us"
    cloud_resource {}
}

PROJECT_ID를 Google Cloud 프로젝트 ID로 바꿉니다.

연결의 서비스 계정에 권한 부여

Cloud Storage 및 Vertex AI 서비스에 액세스하기 위해 연결의 서비스 계정에 적절한 역할을 부여하려면 다음 단계를 따르세요.

IAM 및 관리자 페이지로 이동합니다.

IAM 및 관리자로 이동
액세스 권한 부여를 클릭합니다.
새 주 구성원 필드에 앞에서 복사한 서비스 계정 ID를 입력합니다.
역할 선택 필드에서 Vertex AI를 선택한 후 Vertex AI 사용자를 선택합니다.
다른 역할 추가를 클릭합니다.
역할 선택 필드에서 Cloud Storage를 선택한 후 스토리지 객체 뷰어를 선택합니다.
저장을 클릭합니다.

객체 테이블 만들기

공개 Cloud Storage 버킷에서 영화 포스터 이미지 위에 객체 테이블을 만듭니다. 객체 테이블을 사용하면 Cloud Storage에서 이미지를 이동하지 않고 이미지를 분석할 수 있습니다.

Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

BigQuery로 이동

쿼리 편집기에서 다음 쿼리를 실행하여 객체 테이블을 만듭니다.

CREATE OR REPLACE EXTERNAL TABLE `bqml_tutorial.movie_posters`
  WITH CONNECTION `us.tutorial`
  OPTIONS (
    object_metadata = 'SIMPLE',
    uris =
      ['gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters/*']);

원격 모델 만들기

Vertex AI gemini-1.0-pro-vision 모델을 나타내는 원격 모델을 만듭니다.

Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

BigQuery로 이동
쿼리 편집기에서 다음 쿼리를 실행하여 원격 모델을 만듭니다.
```
CREATE OR REPLACE MODEL `bqml_tutorial.gemini-pro-vision`
  REMOTE WITH CONNECTION `us.tutorial`
  OPTIONS (ENDPOINT = 'gemini-pro-vision');
```
쿼리가 완료되는 데 몇 초 정도 걸리며 그 이후에는 gemini-pro-vision 모델이 탐색기 창의 bqml_tutorial 데이터 세트에 표시됩니다. 이 쿼리에서는 CREATE MODEL 문을 사용하여 모델을 만들므로 쿼리 결과가 없습니다.

영화 포스터 분석

원격 모델을 사용하여 영화 포스터를 분석하고 각 포스터가 나타내는 영화를 확인한 후 이 데이터를 테이블에 작성합니다.

Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

BigQuery로 이동

쿼리 편집기에서 다음 쿼리를 실행하여 영화 포스터 이미지를 분석합니다.

CREATE OR REPLACE TABLE
  `bqml_tutorial.movie_posters_results` AS (
  SELECT
    uri,
    ml_generate_text_llm_result
  FROM
    ML.GENERATE_TEXT( MODEL `bqml_tutorial.gemini-pro-vision`,
      TABLE `bqml_tutorial.movie_posters`,
      STRUCT( 0.2 AS temperature,
        'For the movie represented by this poster, what is the movie title and year of release? Answer in JSON format with two keys: title, year. title should be string, year should be integer.' AS PROMPT,
        TRUE AS FLATTEN_JSON_OUTPUT)));

쿼리 편집기에서 다음 문을 실행하여 테이블 데이터를 확인합니다.

SELECT * FROM `bqml_tutorial.movie_posters_results`;

출력은 다음과 비슷합니다.

+--------------------------------------------+----------------------------------+
| uri                                        | ml_generate_text_llm_result      |
+--------------------------------------------+----------------------------------+
| gs://cloud-samples-data/vertex-ai/dataset- | ```json                          |
| management/datasets/classic-movie-         | {                                |
| posters/little_annie_rooney.jpg            |  "title": "Little Annie Rooney", |
|                                            |  "year": 1912                    |
|                                            | }                                |
|                                            | ```                              |
+--------------------------------------------+----------------------------------+
| gs://cloud-samples-data/vertex-ai/dataset- | ```json                          |
| management/datasets/classic-movie-         | {                                |
| posters/mighty_like_a_mouse.jpg            |  "title": "Mighty Like a Moose", |
|                                            |  "year": 1926                    |
|                                            | }                                |
|                                            | ```                              |
+--------------------------------------------+----------------------------------+
| gs://cloud-samples-data/vertex-ai/dataset- | ```json                          |
| management/datasets/classic-movie-         | {                                |
| posters/brown_of_harvard.jpeg              |  "title": "Brown of Harvard",    |
|                                            |  "year": 1926                    |
|                                            | }                                |
|                                            | ```                              |
+--------------------------------------------+----------------------------------+

모델 출력 형식 지정

모델에서 반환된 영화 분석 데이터의 형식을 지정하여 영화 제목과 연도 데이터를 더 쉽게 읽을 수 있도록 합니다.

Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

BigQuery로 이동

쿼리 편집기에서 다음 쿼리를 실행하여 데이터 형식을 지정합니다.

CREATE OR REPLACE TABLE
  `bqml_tutorial.movie_posters_results_formatted` AS (
  SELECT
    uri,
    JSON_QUERY(RTRIM(LTRIM(results.ml_generate_text_llm_result, " ```json"), "```"), "$.title") AS title,
    JSON_QUERY(RTRIM(LTRIM(results.ml_generate_text_llm_result, " ```json"), "```"), "$.year") AS year
  FROM
    `bqml_tutorial.movie_posters_results` results );

쿼리 편집기에서 다음 문을 실행하여 테이블 데이터를 확인합니다.

SELECT * FROM `bqml_tutorial.movie_posters_results_formatted`;

출력은 다음과 비슷합니다.

+--------------------------------------------+----------------------------+------+
| uri                                        | title                      | year |
+--------------------------------------------+----------------------------+------+
| gs://cloud-samples-data/vertex-ai/dataset- | "Barque sortant du port"   | 1895 |
| management/datasets/classic-movie-         |                            |      |
| posters/barque_sortant_du_port.jpeg        |                            |      |
+--------------------------------------------+----------------------------+------+
| gs://cloud-samples-data/vertex-ai/dataset- | "The Great Train Robbery"  | 1903 |
| management/datasets/classic-movie-         |                            |      |
| posters/the_great_train_robbery.jpg        |                            |      |
+--------------------------------------------+----------------------------+------+
| gs://cloud-samples-data/vertex-ai/dataset- | "Little Annie Rooney"      | 1912 |
| management/datasets/classic-movie-         |                            |      |
| posters/little_annie_rooney.jpg            |                            |      |
+--------------------------------------------+----------------------------+------+

삭제

주의: 프로젝트를 삭제하면 다음과 같은 효과가 발생합니다.

프로젝트의 모든 항목이 삭제됩니다. 이 문서의 태스크에 기존 프로젝트를 사용한 경우 프로젝트를 삭제하면 프로젝트에서 수행한 다른 작업도 삭제됩니다.
커스텀 프로젝트 ID가 손실됩니다. 이 프로젝트를 만들 때 앞으로 사용할 커스텀 프로젝트 ID를 만들었을 수 있습니다. appspot.com URL과 같이 프로젝트 ID를 사용하는 URL을 보존하려면 전체 프로젝트를 삭제하는 대신 프로젝트 내에서 선택한 리소스만 삭제합니다.

여러 아키텍처, 튜토리얼, 빠른 시작을 살펴보려는 경우 프로젝트를 재사용하면 프로젝트 할당량 한도 초과를 방지할 수 있습니다.

Google Cloud 콘솔에서 리소스 관리 페이지로 이동합니다.
리소스 관리로 이동
프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제를 클릭합니다.
대화상자에서 프로젝트 ID를 입력한 후 종료를 클릭하여 프로젝트를 삭제합니다.