Creare un'applicazione di AI generativa su Google Cloud

Questa pagina è stata tradotta dall'API Cloud Translation.

Crea un'applicazione di AI generativa su Google Cloud

Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello enterprise.

Utilizza questa pagina per apprendere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.

Apprendi le nozioni di base dello sviluppo dell'AI generativa

Scopri come sviluppare un'applicazione di AI generativa.

Scopri di più sui casi d'uso e sui tipi di modelli comuni dell'AI generativa.

Quando utilizzare l'AI generativa o l'AI tradizionale

Identifica se AI generativa, l'AI tradizionale o una combinazione di entrambe potrebbe essere adatta al tuo caso d'uso aziendale.

Panoramica dello sviluppo di un'applicazione di AI generativa

Scopri come affrontare le sfide in ogni fase dello sviluppo di un'applicazione di AI generativa.

Scegli l'infrastruttura per la tua applicazione di AI generativa

Scopri quali prodotti, framework e strumenti sono più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata su cloud includono:

Hosting di applicazioni:esegui il calcolo per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
Hosting di modelli:hosting scalabile e sicuro per un modello generativo.
Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
Soluzione di grounding: ancora l'output del modello a fonti di informazioni verificabili e aggiornate.
Database:archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt tramite query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
Spazio di archiviazione:archivia i file come immagini, video o frontend web statici. Potresti anche usare Storage per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivi in un database vettoriale.

Diagramma che mostra una panoramica generale di un'infrastruttura di hosting di applicazioni di AI generativa, inclusi un modello e la relativa infrastruttura di hosting, soluzione di grounding, database, archiviazione e hosting di applicazioni.

Le sezioni seguenti illustrano ciascun componente per aiutarti a scegliere quali prodotti Google Cloud provare.

Infrastruttura di hosting delle applicazioni

Scegli un prodotto per ospitare e gestire il carico di lavoro dell'applicazione, in modo da effettuare chiamate al modello generativo.

Per iniziare:

Infrastruttura di hosting di modelli

Google Cloud offre diversi modi per ospitare un modello generativo, dalla piattaforma di punta Vertex AI all'hosting personalizzabile e portabile su Google Kubernetes Engine.

Albero decisionale che aiuta gli utenti a scegliere il modello giusto di hosting del servizio cloud in base alle loro priorità e ai loro requisiti.

Per iniziare:

Modello

Google Cloud fornisce un set di modelli di base all'avanguardia tramite Vertex AI, incluso Gemini. Puoi anche eseguire il deployment di un modello di terze parti in Vertex AI Model Garden o self-host su GKE, Cloud Run o Compute Engine.

Albero decisionale che aiuta gli utenti a scegliere un servizio Vertex AI per generare testo o codice, con opzioni per l'utilizzo di incorporamenti di testo, immagini o video.

Per iniziare:

Gemini
Codey
Immagini
incorporamento del testo
Vertex AI Model Garden (modelli open source)
HuggingFace Model Hub (modelli open source)

Grounding

Per garantire risposte informate e precise, può essere opportuno basare la tua applicazione di AI generativa con dati in tempo reale. Questa procedura è chiamata generazione avanzata di recupero (RAG).

Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre diverse soluzioni di database vettoriali, per diversi casi d'uso.

Nota:puoi anche iniziare a utilizzare database tradizionali (non vettoriali), semplicemente eseguendo una query su un database esistente, come Cloud SQL o Firestore, e utilizzando il risultato nel prompt del modello.

Albero decisionale che aiuta l'utente a scegliere la soluzione di database vettoriale giusta per le sue esigenze.

Per iniziare:

Vertex AI Agent Builder (in precedenza Enterprise Search, Gen AI App Builder, Discovery Engine)
Vector Search (in precedenza Matching Engine)
AlloyDB per PostgreSQL
Cloud SQL
BigQuery

Grounding con le API

Invece di (o in aggiunta a) utilizzare i tuoi dati per il grounding, molti servizi online offrono API che puoi utilizzare per recuperare i dati di grounding per aumentare il prompt del modello.

Vertex AI Extensions (anteprima privata)

Crea, esegui il deployment e gestisci estensioni che connettono i modelli linguistici di grandi dimensioni (LLM) alle API dei sistemi esterni.

Componenti Langchain

Esplora un'ampia gamma di caricatori di documenti e integrazioni API per le tue app di AI generativa, da YouTube a Google Scholar.

Grounding in Vertex AI

Se usi modelli ospitati in Vertex AI, puoi basare le risposte del modello utilizzando Vertex AI Search, la Ricerca Google o il testo in linea/infile.

Inizia a creare

Configura l'ambiente di sviluppo

Installa gli strumenti necessari per creare un'applicazione di AI generativa su Google Cloud.

Installa Google Cloud CLI

Strumenti a riga di comando per configurare un ambiente di sviluppo locale e per interagire con le API Cloud.

Installa l'estensione Cloud Code nel tuo IDE

Visualizza la documentazione e gli esempi delle API nel tuo IDE e accelera lo sviluppo locale di GKE e Cloud Run.

Configura l'autenticazione

Scopri come autenticarti alle API Google Cloud dal tuo ambiente locale e dai carichi di lavoro ospitati.

Configurazione di LangChain

LangChain è un framework open source per le app di AI generativa che ti consente di creare un contesto nei tuoi prompt e intervenire in base alla risposta del modello.

Progettare prompt e valutare i modelli

Apprendi le strategie per i prompt e sperimenta con modelli diversi.

Introduzione alla progettazione dei prompt

Scopri le strategie per progettare prompt per diversi tipi di dati, da testo e codice a multimodali.

Vertex AI Studio

Scopri come progettare, testare e gestire i tuoi prompt in Vertex AI Studio.

Esempi di prompt di IA generativa

Visualizza decine di esempi di prompt che coprono casi d'uso tra cui classificazione, ideazione e riassunto.

Ideazione con modelli generativi su Vertex AI

Esplora esempi di prompt per generare, sviluppare e comunicare nuove idee.

Valutazione dei modelli in Vertex AI

Utilizza Vertex AI per eseguire valutazioni basate sulle metriche o valutazioni affiancate.

Esempi di codice

Crea un fork di un esempio su GitHub e inizia a creare.

Chatbot web: rispondere a domande sul Google Store

Impara a creare un chatbot di risposta alle domande basato sul web utilizzando Vertex AI Agent Builder e Firebase.

App di chat con Eventarc e Vertex AI

Impara a creare una semplice applicazione Python Flask che chiama un modello di base preaddestrato in Vertex AI.

Genera una campagna di marketing con Gemini

Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.

App di question answering con "Guida alle MLOps per i professionisti"

Scopri come utilizzare Vertex AI Search e LangChain per fondare i prompt dei modelli a una fonte di conoscenza verificabile (white paper Google Cloud).

Assistente richieste API Weather: chiamata di funzione con Gemini

Scopri come implementare le chiamate di funzione, il processo di utilizzo di un LLM per compilare un corpo di richiesta che puoi poi inviare a un'API esterna.

Assistente aeroportuale: app di recupero dei database di IA generativa

App di esempio per la generazione avanzata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).

Indicazioni per l'architettura e soluzioni di avvio rapido

Suggerimenti ed esempi di applicazioni di AI generativa sicure, efficienti, resilienti, ad alte prestazioni ed economiche.

Infrastruttura per un'applicazione di IA generativa con funzionalità RAG utilizzando Vertex AI

Utilizza questa architettura di riferimento per progettare l'infrastruttura per l'esecuzione di un'applicazione di IA generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando Vertex AI e AlloyDB per PostgreSQL.

Infrastruttura per un'applicazione di AI generativa con funzionalità RAG utilizzando GKE

Utilizza questa architettura di riferimento per progettare l'infrastruttura per eseguire un'applicazione di AI generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando GKE, Cloud SQL e strumenti open source come Ray, Hugging Face e LangChain.

Crea un'applicazione di AI generativa su Google Cloud

Apprendi le nozioni di base dello sviluppo dell'AI generativa

Quando utilizzare l'AI generativa o l'AI tradizionale

Panoramica dello sviluppo di un'applicazione di AI generativa

Scegli l'infrastruttura per la tua applicazione di AI generativa

Infrastruttura di hosting delle applicazioni

Infrastruttura di hosting di modelli

Modello

Grounding

Grounding con le API

Vertex AI Extensions (anteprima privata)

Componenti Langchain

Grounding in Vertex AI

Inizia a creare

Configura l'ambiente di sviluppo

Installa Google Cloud CLI

Installa l'estensione Cloud Code nel tuo IDE

Configura l'autenticazione

Configurazione di LangChain

Progettare prompt e valutare i modelli

Introduzione alla progettazione dei prompt

Vertex AI Studio

Esempi di prompt di IA generativa

Ideazione con modelli generativi su Vertex AI

Valutazione dei modelli in Vertex AI

Esempi di codice

Chatbot web: rispondere a domande sul Google Store

App di chat con Eventarc e Vertex AI

Genera una campagna di marketing con Gemini

App di question answering con "Guida alle MLOps per i professionisti"

Assistente richieste API Weather: chiamata di funzione con Gemini

Assistente aeroportuale: app di recupero dei database di IA generativa

Indicazioni per l'architettura e soluzioni di avvio rapido

Infrastruttura per un'applicazione di IA generativa con funzionalità RAG utilizzando Vertex AI

Infrastruttura per un'applicazione di AI generativa con funzionalità RAG utilizzando GKE

Progetta l'archiviazione per i carichi di lavoro di AI e ML in Google Cloud

Soluzione di avvio rapido: riassunto di documenti

Soluzione di avvio rapido: RAG di IA generativa con Cloud SQL

Soluzione di avvio rapido: knowledge base di IA generativa