Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello enterprise.

Utilizza questa pagina per apprendere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.

Apprendi le nozioni di base dello sviluppo dell'AI generativa

Scopri come sviluppare un'applicazione di AI generativa.
Scopri di più sui casi d'uso e sui tipi di modelli comuni dell'AI generativa.
Identifica se AI generativa, l'AI tradizionale o una combinazione di entrambe potrebbe essere adatta al tuo caso d'uso aziendale.
Scopri come affrontare le sfide in ogni fase dello sviluppo di un'applicazione di AI generativa.

Scegli l'infrastruttura per la tua applicazione di AI generativa

Scopri quali prodotti, framework e strumenti sono più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata su cloud includono:

  1. Hosting di applicazioni:esegui il calcolo per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
  2. Hosting di modelli:hosting scalabile e sicuro per un modello generativo.
  3. Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
  4. Soluzione di grounding: ancora l'output del modello a fonti di informazioni verificabili e aggiornate.
  5. Database:archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt tramite query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
  6. Spazio di archiviazione:archivia i file come immagini, video o frontend web statici. Potresti anche usare Storage per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivi in un database vettoriale.

Diagramma che mostra una panoramica generale di un'infrastruttura di hosting di applicazioni di AI generativa, inclusi un modello e la relativa infrastruttura di hosting, soluzione di grounding, database, archiviazione e hosting di applicazioni.

Le sezioni seguenti illustrano ciascun componente per aiutarti a scegliere quali prodotti Google Cloud provare.

Infrastruttura di hosting delle applicazioni

Scegli un prodotto per ospitare e gestire il carico di lavoro dell'applicazione, in modo da effettuare chiamate al modello generativo.
Struttura decisionale che guida gli utenti nella scelta di un servizio appropriato per l'hosting delle applicazioni.

Per iniziare:

Infrastruttura di hosting di modelli

Google Cloud offre diversi modi per ospitare un modello generativo, dalla piattaforma di punta Vertex AI all'hosting personalizzabile e portabile su Google Kubernetes Engine.

Albero decisionale che aiuta gli utenti a scegliere il modello giusto di hosting del servizio cloud in base alle loro priorità e ai loro requisiti.

Per iniziare:

Modello

Google Cloud fornisce un set di modelli di base all'avanguardia tramite Vertex AI, incluso Gemini. Puoi anche eseguire il deployment di un modello di terze parti in Vertex AI Model Garden o self-host su GKE, Cloud Run o Compute Engine.

Albero decisionale che aiuta gli utenti a scegliere un servizio Vertex AI per generare testo o codice, con opzioni per l'utilizzo di incorporamenti di testo, immagini o video.

Per iniziare:

Grounding

Per garantire risposte informate e precise, può essere opportuno basare la tua applicazione di AI generativa con dati in tempo reale. Questa procedura è chiamata generazione avanzata di recupero (RAG).

Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre diverse soluzioni di database vettoriali, per diversi casi d'uso.

Nota:puoi anche iniziare a utilizzare database tradizionali (non vettoriali), semplicemente eseguendo una query su un database esistente, come Cloud SQL o Firestore, e utilizzando il risultato nel prompt del modello.

Albero decisionale che aiuta l'utente a scegliere la soluzione di database vettoriale giusta per le sue esigenze.

Per iniziare:

Grounding con le API

Invece di (o in aggiunta a) utilizzare i tuoi dati per il grounding, molti servizi online offrono API che puoi utilizzare per recuperare i dati di grounding per aumentare il prompt del modello.
Crea, esegui il deployment e gestisci estensioni che connettono i modelli linguistici di grandi dimensioni (LLM) alle API dei sistemi esterni.
Esplora un'ampia gamma di caricatori di documenti e integrazioni API per le tue app di AI generativa, da YouTube a Google Scholar.
Se usi modelli ospitati in Vertex AI, puoi basare le risposte del modello utilizzando Vertex AI Search, la Ricerca Google o il testo in linea/infile.

Inizia a creare

Configura l'ambiente di sviluppo

Installa gli strumenti necessari per creare un'applicazione di AI generativa su Google Cloud.
Strumenti a riga di comando per configurare un ambiente di sviluppo locale e per interagire con le API Cloud.
Visualizza la documentazione e gli esempi delle API nel tuo IDE e accelera lo sviluppo locale di GKE e Cloud Run.
Scopri come autenticarti alle API Google Cloud dal tuo ambiente locale e dai carichi di lavoro ospitati.
LangChain è un framework open source per le app di AI generativa che ti consente di creare un contesto nei tuoi prompt e intervenire in base alla risposta del modello.

Progettare prompt e valutare i modelli

Apprendi le strategie per i prompt e sperimenta con modelli diversi.
Scopri le strategie per progettare prompt per diversi tipi di dati, da testo e codice a multimodali.
Scopri come progettare, testare e gestire i tuoi prompt in Vertex AI Studio.
Visualizza decine di esempi di prompt che coprono casi d'uso tra cui classificazione, ideazione e riassunto.
Esplora esempi di prompt per generare, sviluppare e comunicare nuove idee.

Esempi di codice

Crea un fork di un esempio su GitHub e inizia a creare.

Impara a creare un chatbot di risposta alle domande basato sul web utilizzando Vertex AI Agent Builder e Firebase.

Principiante Node.js

Impara a creare una semplice applicazione Python Flask che chiama un modello di base preaddestrato in Vertex AI.

Principiante Python

Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.

Principiante Python

Scopri come utilizzare Vertex AI Search e LangChain per fondare i prompt dei modelli a una fonte di conoscenza verificabile (white paper Google Cloud).

Intermedio Python

Scopri come implementare le chiamate di funzione, il processo di utilizzo di un LLM per compilare un corpo di richiesta che puoi poi inviare a un'API esterna.

Intermedio Python

App di esempio per la generazione avanzata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).

Intermedio Python

Indicazioni per l'architettura e soluzioni di avvio rapido

Suggerimenti ed esempi di applicazioni di AI generativa sicure, efficienti, resilienti, ad alte prestazioni ed economiche.

Utilizza questa architettura di riferimento per progettare l'infrastruttura per l'esecuzione di un'applicazione di IA generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando Vertex AI e AlloyDB per PostgreSQL.

Intermedio

Utilizza questa architettura di riferimento per progettare l'infrastruttura per eseguire un'applicazione di AI generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando GKE, Cloud SQL e strumenti open source come Ray, Hugging Face e LangChain.

Intermedio

Questo documento fornisce indicazioni sulla progettazione su come utilizzare e integrare la varietà di opzioni di archiviazione offerte da Google Cloud per i principali carichi di lavoro AI e ML.

Avanzata

Esegui il deployment di un'applicazione di esempio con un solo clic per riassumere documenti lunghi con Vertex AI.

Intermedio

Esegui il deployment di un'applicazione di esempio con un solo clic che utilizza incorporamenti vettoriali archiviati in Cloud SQL per migliorare l'accuratezza delle risposte da un'applicazione di chat.

Intermedio

Esegui il deployment di un'applicazione di esempio con un solo clic che estrae le coppie domanda e risposta da un insieme di documenti, oltre a una pipeline che attiva l'applicazione quando viene caricato un documento.

Intermedio