Pelatihan PyTorch yang efisien dengan data cloud

Penelusuran Arsitektur Neural Vertex AI tidak memiliki persyaratan yang menjelaskan cara mendesain pelatih Anda. Oleh karena itu, pilih framework pelatihan untuk membangun pelatih.

Untuk pelatihan PyTorch dengan data dalam jumlah besar, praktik terbaiknya adalah menggunakan paradigma pelatihan terdistribusi dan membaca data dari Cloud Storage. Lihat postingan blog Pelatihan PyTorch yang efisien dengan Vertex AI guna mengetahui metode untuk meningkatkan performa pelatihan. Anda dapat melihat peningkatan performa 6x lipat secara keseluruhan dengan data di Cloud Storage menggunakan WebDataset dan memilih strategi pelatihan terdistribusi DistributedDataParallel atau FullyShardedDataParallel. Performa pelatihan menggunakan data di Cloud Storage serupa dengan performa pelatihan menggunakan data di disk lokal.

Contoh klasifikasi MNasNet bawaan telah menerapkan metode ini ke dalam pipeline pelatihannya.