Prova i modelli Gemini 1.5, i nostri più recenti modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra di contesto dei token da 1 milione. Prova i modelli Gemini 1.5, i nostri più recenti modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra di contesto dei token da 1 milione.

Questa pagina è stata tradotta dall'API Cloud Translation.

Panoramica della risorsa permanente

Una risorsa permanente Vertex AI è un cluster a lunga esecuzione che puoi creare per eseguire job di addestramento personalizzato. Al termine di un job di addestramento, la risorsa permanente rimane disponibile per eseguire altri job di addestramento fino a quando non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e per ridurre i tempi di avvio dei job altrimenti necessari per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate da job di addestramento personalizzato. Questa pagina spiega quando utilizzare una risorsa permanente e fornisce informazioni su fatturazione e quota.

Quando utilizzare una risorsa permanente

Ti consigliamo di utilizzare risorse permanenti nei seguenti scenari:

Vuoi garantire la disponibilità della capacità per i carichi di lavoro ML critici o durante i periodi di alta stagione. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa dopo il completamento del job, la risorsa permanente rimane disponibile finché non viene eliminata.
Stai inviando lo stesso job più volte e puoi trarre vantaggio dalla memorizzazione nella cache di dati e immagini eseguendo i job sulla stessa risorsa permanente.
Hai molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è più breve rispetto a quello di avvio del job.

Per saperne di più su quando e perché utilizzare una risorsa persistente, consulta il post del blog Bringing Cartellitability and Faster start time to Vertex AI Training.

Dettagli di fatturazione

Ti viene addebitato il costo per l'intera durata del tempo in cui una risorsa permanente è in esecuzione, a prescindere dal fatto che ci sia un job in esecuzione sulla risorsa permanente. Per ogni istanza nel pool di risorse permanenti, i costi sono addebitati per ora core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.

Se configuri la scalabilità automatica per la risorsa permanente, paghi solo per le istanze di cui è stato eseguito il provisioning. Ad esempio, se min-replica-count è impostato su 4, viene sempre eseguito il provisioning di 4 istanze e questo è l'importo minimo che ti viene addebitato. Quando il carico di lavoro aumenta, il pool di risorse potrebbe fare lo scale up fino a 6 per soddisfare l'aumento della domanda. A quel punto, ti verrà addebitato il costo per 6 istanze di cui è stato eseguito il provisioning fino a quando il pool di risorse non fa nuovamente lo scale down. Per evitare di pagare per i nodi inattivi, utilizza la scalabilità automatica per la risorsa permanente o eliminala quando non ne hai più bisogno. Per saperne di più sui prezzi, consulta la sezione Modelli addestrati personalizzati nella pagina dei prezzi di Vertex AI.

Quote

Le risorse permanenti utilizzano la tua quota di addestramento, quindi verifica di disporre di una quota sufficiente per la creazione di risorse permanenti. Per scoprire di più sulle quote, consulta Quote e limiti di addestramento.

Panoramica della risorsa permanente

Quando utilizzare una risorsa permanente

Dettagli di fatturazione

Quote

Passaggi successivi