Data tabulasi Hello: Membuat set data dan melatih model klasifikasi AutoML

Gunakan Konsol Google Cloud untuk membuat set data tabulasi dan melatih model klasifikasi.

Membuat set data tabulasi

  1. Di Konsol Google Cloud, di bagian Vertex AI, buka halaman Datasets.

    Buka halaman Datasets

  2. Klik Create di panel tombol untuk membuat set data yang baru.

  3. Masukkan Structured_AutoML_Tutorial untuk nama set data, lalu pilih tab Tabular.

  4. Pilih objektif Regression/Classification.

    Biarkan Region ditetapkan ke us-central1.

  5. Klik Create untuk membuat set data tersebut.

    Untuk tutorial ini, Anda akan menggunakan set data bank yang tersedia secara publik, yang dihosting melalui Cloud Storage.

  6. Untuk Select a data source, klik Select CSV files from Cloud Storage

  7. Di Import file path, masukkan cloud-ml-tables-data/bank-marketing.csv

  8. Klik Lanjutkan.

Menganalisis set data

Bagian analisis memungkinkan Anda untuk melihat informasi lebih lanjut tentang set data, seperti nilai yang tidak ada atau NULL.

Karena set data kami telah diformat dengan benar untuk tutorial ini, Anda tidak perlu melakukan apa pun pada halaman ini, dan dapat melewati bagian ini.

  1. Opsional. Klik Generate statistics untuk melihat jumlah nilai yang hilang, atau NULL di dalam set data. Proses ini dapat memerlukan waktu 10 menit atau lebih.

  2. Opsional. Klik salah satu dari kolom fitur untuk mempelajari nilai datanya lebih lanjut.

Melatih model klasifikasi AutoML

  1. Klik Train new model.

  2. Pilih Other.

  3. Di panel Training method, pastikan set data yang telah Anda buat sebelumnya dipilih untuk kolom Dataset.

  4. Untuk kolom Objective, pilih Classification.

  5. Pastikan metode pelatihan AutoML yang dipilih.

  6. Klik Lanjutkan.

  7. Di dalam panel Model details, pilih Deposit untuk kolom target, lalu klik Continue.

    Kolom target adalah kolom yang kami latih agar dapat diprediksi oleh model tersebut. Untuk set data bank-marketing.csv, kolom Deposit menunjukkan apakah klien membeli deposito berjangka (2 = yes, 1 = no).

    Panel Training options memberikan Anda peluang untuk menambahkan fitur, dan mengubah data kolom. Jika tidak ada kolom yang dipilih, maka secara default semua kolom non-target akan digunakan sebagai fitur untuk pelatihan. Set data ini siap untuk digunakan, sehingga tidak perlu menerapkan transformasi apa pun.

  8. Klik Lanjutkan.

  9. Di dalam panel Compute and Pricing, masukkan 1 untuk anggaran pelatihan.

    Anggaran pelatihan menentukan waktu pelatihan yang sebenarnya, tetapi waktu untuk menyelesaikan pelatihan mencakup aktivitas lain, sehingga seluruh proses dapat memerlukan waktu lebih dari satu jam. Setelah selesai dilatih, model akan ditampilkan di dalam tab model sebagai link langsung, dengan ikon status tanda centang hijau.

  10. Klik Start training.

Langkah berikutnya

Model Anda sekarang sedang dilatih, yang dapat memerlukan waktu satu jam atau lebih untuk diselesaikan. Anda akan menerima email saat penyiapannya selesai. Setelah pelatihan model Anda selesai, ikuti halaman berikutnya dalam tutorial ini untuk men-deploy model Anda dan meminta prediksi.

Tutorial ini menggunakan set data yang telah dibersihkan dan diformat untuk pelatihan AutoML, tetapi sebagian besar data akan memerlukan beberapa upaya sebelum siap untuk digunakan. Kualitas data pelatihan Anda memengaruhi efektivitas model yang Anda buat. Pelajari lebih lanjut cara untuk menyiapkan data.

Mencari dan menyiapkan data Anda sangat penting untuk memastikan model machine learning yang akurat. Pelajari lebih lanjut tentang praktik terbaik.

Pelajari lebih lanjut cara untuk membuat set data tabulasi.

Vertex AI menawarkan dua metode pelatihan model, yakni AutoML dan pelatihan kustom. AutoML memungkinkan Anda untuk melakukan pelatihan dengan upaya dan pengalaman machine learning yang minimal, sementara pelatihan kustom memberi Anda kontrol penuh atas fungsionalitas pelatihan. Pelajari lebih lanjut tentang metode pelatihan.

Vertex AI memeriksa jenis data sumber dan nilai fitur serta menyimpulkan cara untuk menggunakan fitur tersebut dalam pelatihan model. Anda disarankan untuk meninjau setiap jenis data kolom, untuk memverifikasi bahwa jenis data tersebut telah ditafsirkan dengan benar. Jika diperlukan, Anda dapat menentukan transformasi lain yang didukung untuk fitur apa pun. Pelajari lebih lanjut tentang transformasi.

Pelajari lebih lanjut tentang cara melatih AutoML untuk klasifikasi atau regresi.