Membuat Jupyter Notebook

Dalam tutorial ini, Anda menggunakan Vertex AI SDK di Notebook Jupyter untuk mendapatkan prediksi menggunakan instance Vertex AI Workbench.

Bagian ini menunjukkan cara membuat notebook Jupyter dalam instance Vertex AI Workbench. Instance Vertex AI Workbench adalah lingkungan pengembangan berbasis Jupyter Notebook untuk seluruh alur kerja data science. Instance Vertex AI Workbench sudah dikemas dengan JupyterLab dan memiliki rangkaian paket deep learning bawaan, termasuk dukungan untuk framework TensorFlow dan PyTorch. Untuk mengetahui informasi selengkapnya, lihat Pengantar instance Vertex AI Workbench.

Setelah membuat notebook di Vertex AI Workbench, jalankan bagian-bagian kode Python yang berurutan untuk melakukan sebagian besar pekerjaan guna membuat prediksi.

Membuat instance Vertex AI Workbench

Untuk membuat instance Vertex AI Workbench, lakukan hal berikut:

  1. Di konsol Google Cloud, buka project Google Cloud Anda jika belum terbuka.

  2. Di konsol Google Cloud, buka halaman Instances Vertex AI Workbench.

    Buka Instance

  3. Jika opsi untuk mengaktifkan Notebooks API muncul, klik Aktifkan. Mungkin perlu waktu beberapa saat untuk menyelesaikan proses pengaktifan.

  4. Klik  Buat baru.

  5. Pada dialog New instance, untuk Name, masukkan nama instance Anda.

  6. Untuk Region, pilih us-central1 (Iowa).

  7. Untuk Zone, pilih us-central1-a.

  8. Klik Create. Jika ingin mempelajari lebih lanjut instance, setelah instance muncul dalam daftar instance, klik namanya untuk melihat propertinya.

Menyiapkan notebook

Instance Vertex AI Workbench Anda sudah diautentikasi untuk menggunakan project Google Cloud. Namun, Anda harus menginstal dan melakukan inisialisasi Vertex AI SDK untuk Python. Bagian ini akan memandu Anda melakukan langkah-langkah ini.

Setelah membuat notebook, Anda akan menggunakannya untuk memasukkan dan menjalankan cuplikan kode berurutan dalam tutorial ini. Setiap cuplikan kode harus dijalankan satu per satu dan secara berurutan.

Buat dan buka notebook Anda

Notebook Anda merupakan tempat bagi Anda untuk menjalankan kode dalam tutorial ini. Notebook adalah file dengan ekstensi .ipynb. Saat Anda membuatnya, file tersebut tidak diberi judul. Anda dapat mengganti namanya setelah dibuka. Untuk membuat dan membuka {i>notebook<i} Anda, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman Instance.

    Buka Instance

  2. Di samping nama instance, klik Open JupyterLab.

    Instance Vertex AI Workbench Anda membuka lingkungan JupyterLab.

  3. Di JupyterLab, pilih File > New > Notebook.

    File notebook baru akan terbuka.

  4. Di panel navigasi kiri JupyterLab, temukan notebook baru Anda, bernama Untitled.ipynb. Untuk mengganti namanya, klik kanan nama notebook Anda, klik Rename, lalu masukkan nama baru.

Menginstal Vertex AI SDK untuk Python

Setelah membuka notebook, Anda harus menginstal Vertex AI SDK untuk Python. Anda dapat menggunakan Vertex AI SDK untuk Python guna melakukan panggilan Vertex AI API yang membuat set data, membuat model, melatih dan men-deploy model, serta membuat prediksi dengan model Anda. Untuk mengetahui informasi selengkapnya, lihat Menggunakan Vertex AI SDK untuk Python.

Saat Anda menginstal Vertex AI SDK untuk Python, Google Cloud SDK lain yang bergantung padanya juga akan diinstal. Dua dari Google Cloud SDK tersebut digunakan dalam tutorial ini:

  • Cloud Storage - Saat Anda menggunakan Vertex AI SDK untuk Python guna melakukan panggilan Vertex AI API, Vertex AI akan menyimpan artefak di bucket Cloud Storage. Bucket ini disebut sebagai bucket staging. Anda menentukan bucket staging saat Anda melakukan inisialisasi Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat klien Python untuk Google Cloud Storage API.

  • BigQuery - Vertex AI melatih model Anda menggunakan set data publik BigQuery. BigQuery SDK harus diinstal guna mengakses dan mendownload set data yang digunakan dalam tutorial ini. Untuk mengetahui informasi selengkapnya, lihat library klien BigQuery API.

Guna menginstal Vertex AI SDK untuk Python dan SDK yang berkaitan dengannya, jalankan kode berikut.

# Install the Vertex AI SDK
! pip3 install --upgrade --quiet google-cloud-aiplatform

Flag --quiet menyembunyikan output sehingga hanya error yang ditampilkan, jika ada. Tanda seru (!) menunjukkan bahwa kode tersebut adalah perintah shell.

Karena ini adalah kode pertama yang Anda jalankan di notebook baru, Anda harus memasukkannya ke dalam sel kode kosong di bagian atas notebook. Setelah memasukkan kode dalam sel kode, klik  Jalankan sel yang dipilih dan lanjutkan atau gunakan pintasan keyboard Shift + Enter untuk menjalankan kode.

Menjalankan kode untuk menginstal SDK.

Dalam langkah selanjutnya dari tutorial ini, Anda dapat menjalankan kode dalam sel kode kosong yang otomatis muncul di bawah kode yang terakhir dijalankan. Jika Anda ingin menambahkan sel kode baru secara manual, klik tombol  Sisipkan sel di bawah pada file notebook.

Menambahkan sel kode baru.

Menetapkan ID project dan region

Pada langkah ini, Anda akan menetapkan ID project dan region Anda. Tetapkan ID project dan region ke variabel terlebih dahulu, sehingga keduanya dapat dirujuk dengan mudah pada bagian selanjutnya dalam tutorial ini. Kemudian, gunakan perintah gcloud config untuk menetapkan ID project dan region untuk sesi Google Cloud Anda. Kemudian, Anda akan menggunakannya dan URI bucket Cloud Storage untuk menginisialisasi Vertex AI SDK untuk Python.

Menetapkan ID project

Untuk menetapkan ID project, lakukan hal berikut:

  1. Temukan ID project Google Cloud Anda. Untuk mengetahui informasi selengkapnya, lihat Menemukan ID project.

  2. Jalankan kode berikut dalam sel kode di notebook Anda. Dalam kode, ganti MY_PROJECT_ID dengan ID project yang baru saja Anda temukan. Output yang dihasilkan perintah ini adalah Updated property [core/project].

    project_id = "MY_PROJECT_ID"  # @param {type:"string"}
    # Set the project id
    ! gcloud config set project {project_id}
    

Menetapkan region

Tutorial ini menggunakan region us-central1. Untuk menetapkan region Anda, lakukan hal berikut:

  1. Jalankan kode berikut untuk menetapkan variabel region yang digunakan oleh Vertex AI ke us-central1. Perintah ini tidak menghasilkan output. Untuk mengetahui informasi selengkapnya, lihat Memilih lokasi.

    region = "us-central1"  # @param {type: "string"}
    

Membuat bucket Cloud Storage

Tutorial ini memerlukan bucket Cloud Storage yang digunakan oleh Vertex AI untuk menyiapkan artefak. Vertex AI menyimpan data yang berkaitan dengan set data yang Anda buat dan membuat model sumber daya dalam bucket staging. Data ini akan dipertahankan dan tersedia di seluruh sesi. Dalam tutorial ini, Vertex AI juga menyimpan set data Anda di bucket staging. Anda akan menentukan bucket staging saat Anda melakukan inisialisasi Vertex AI SDK untuk Python.

Setiap nama bucket Cloud Storage harus unik secara global. Jika Anda memilih nama yang telah digunakan, perintah gsutil mb untuk membuat bucket akan gagal. Kode berikut menggunakan stempel datetime dan nama project Anda untuk membuat nama bucket yang unik. Tambahkan nama bucket ke gs:// guna membuat URI untuk bucket Cloud Storage Anda. Perintah shell echo menampilkan URI sehingga Anda dapat memverifikasi bahwa URI dibuat dengan benar.

  1. Untuk menetapkan nama bucket dan URI, jalankan kode berikut. Baris terakhir menampilkan URI bucket Cloud Storage Anda.

    bucket_name = "bucket-name-placeholder"  # @param {type:"string"}
    bucket_uri = f"gs://{bucket_name}"
    
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y%m%d%H%M%S")
    
    if bucket_name == "" or bucket_name is None or bucket_name == "bucket-name-placeholder":
        bucket_name = project_id + "aip-" + timestamp
        bucket_uri = "gs://" + bucket_name
    ! echo $bucket_uri
    
  2. Untuk membuat bucket menggunakan library klien Cloud Storage dan URI bucket, jalankan kode berikut. Kode ini tidak menghasilkan output.

    from google.cloud import storage
    client = storage.Client(project=project_id)
    
    # Create a bucket
    bucket = client.create_bucket(bucket_name, location=region)
    
  3. Untuk memverifikasi bahwa bucket Anda berhasil dibuat, jalankan perintah berikut:

    print("Bucket {} created.".format(bucket.name))
    

Melakukan inisialisasi Vertex AI SDK untuk Python

Guna melakukan inisialisasi Vertex AI SDK untuk Python, Anda harus terlebih dahulu mengimpor library-nya, aiplatform. Selanjutnya, panggil aiplatform.init dan teruskan nilai untuk parameter berikut:

  • project - project menentukan project Google Cloud yang akan digunakan saat Anda menggunakan Vertex AI SDK untuk Python guna melakukan panggilan ke Vertex AI API. Dalam tutorial ini, Anda akan menentukan project Google Cloud dengan namanya. Anda juga dapat menentukan project dengan nomor project-nya.

  • location - location menentukan region Google Cloud yang akan digunakan saat Anda melakukan panggilan API. Jika Anda tidak menentukan lokasi, Vertex AI SDK untuk Python akan menggunakan us-central1.

  • staging_bucket - staging_bucket menentukan bucket Cloud Storage yang akan digunakan untuk menyiapkan artefak saat Anda menggunakan Vertex AI SDK untuk Python. Tentukan bucket dengan URI yang diawali dengan gs://. Dalam tutorial ini, Anda akan menggunakan URI yang dibuat sebelumnya di bagian Membuat bucket Cloud Storage.

Untuk menetapkan project Google Cloud, region, dan bucket staging, jalankan perintah berikut. Perintah ini tidak menghasilkan output.

from google.cloud import aiplatform

# Initialize the Vertex AI SDK
aiplatform.init(project=project_id, location=region, staging_bucket=bucket_uri)

Melakukan inisialisasi BigQuery

Tutorial ini menggunakan set data publik BigQuery yang berisi penguin untuk melatih sebuah model. Setelah Vertex AI melatih model, tentukan parameter yang merepresentasikan karakteristik penguin. Model akan menggunakan karakteristik tersebut untuk memprediksi spesies penguin yang direpresentasikan. Untuk mengetahui informasi selengkapnya tentang set data publik, lihat set data publik BigQuery.

Sebelum menggunakan set data BigQuery, Anda harus melakukan inisialisasi BigQuery dengan ID project Anda. Untuk melakukannya, jalankan perintah berikut. Perintah ini tidak menghasilkan output.

from google.cloud import bigquery

# Set up BigQuery client
bq_client = bigquery.Client(project=project_id)