Coba model Gemini 1.5, model multimodal terbaru kami di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token 1 juta. Coba model Gemini 1.5, model multimodal terbaru kami di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token sebesar 1 juta.

Ringkasan resource persisten

Resource persisten Vertex AI adalah cluster yang berjalan lama, yang dapat Anda buat untuk menjalankan tugas pelatihan kustom. Setelah tugas pelatihan selesai, resource persisten akan tetap tersedia untuk menjalankan tugas pelatihan lainnya sampai Anda menghapusnya. Anda dapat menggunakan resource persisten untuk memastikan ketersediaan resource komputasi, dan untuk mengurangi waktu startup tugas yang biasanya diperlukan untuk pembuatan resource komputasi. Halaman ini menjelaskan kapan Anda harus menggunakan resource persisten, serta memberikan Anda informasi terkait penagihan dan kuota.

Kapan harus menggunakan resource persisten

Sebaiknya gunakan resource persisten dalam skenario berikut ini:

Anda ingin memastikan ketersediaan kapasitas untuk workload ML penting atau selama musim puncak. Tidak seperti tugas kustom, yang mengharuskan layanan pelatihan untuk merilis resource setelah tugas selesai, resource persisten akan tetap tersedia hingga resource persisten tersebut dihapus.
Anda mengirimkan tugas yang sama beberapa kali, dan bisa mendapatkan manfaat dari data dan cache gambar dengan menjalankan tugas tersebut pada resource persisten yang sama.
Anda menjalankan banyak tugas pelatihan berjangka pendek, yang waktu pelatihan sebenarnya lebih singkat dari waktu startup tugas.

Untuk mengetahui konteks selengkapnya tentang kapan dan mengapa menggunakan resource persisten, lihat postingan blog Menghadirkan jaminan kapasitas dan waktu startup yang lebih cepat ke Pelatihan Vertex AI.

Detail penagihan

Anda akan dikenai biaya untuk seluruh durasi jika resource persisten berada dalam status berjalan, terlepas dari apakah ada tugas yang berjalan pada resource persisten tersebut, atau tidak. Untuk setiap instance dalam kumpulan resource persisten, Anda akan ditagih berdasarkan jam inti. Semua tugas yang berjalan pada resource persisten tidak dikenai biaya secara terpisah. Anda hanya ditagih untuk resource persisten.

Jika menyiapkan penskalaan otomatis untuk resource persisten, Anda hanya perlu untuk membayar instance yang disediakan. Misalnya, jika min-replica-count ditetapkan ke 4, instance 4 selalu disediakan, dan ini adalah jumlah minimum yang ditagihkan kepada Anda. Saat workload Anda meningkat, kumpulan resource mungkin akan diskalakan hingga 6 untuk mengakomodasi peningkatan permintaan. Kemudian, Anda akan ditagih untuk instance 6 yang disediakan sampai kumpulan resource Anda turun lagi. Agar tidak perlu membayar node yang tidak memiliki aktivitas, gunakan penskalaan otomatis untuk resource persisten, atau hapus resource tersebut saat Anda tidak lagi memerlukannya. Untuk mempelajari harga lebih lanjut, lihat bagian Model yang dilatih khusus di halaman harga Vertex AI.

Kuota

Resource persisten menggunakan kuota pelatihan Anda, sehingga, pastikan Anda memiliki kuota yang cukup untuk pembuatan resource persisten. Untuk mempelajari kuota lebih lanjut, lihat Kuota dan batas pelatihan.

Ringkasan resource persisten

Kapan harus menggunakan resource persisten

Detail penagihan

Kuota

Langkah selanjutnya