Crea un'applicazione di AI generativa su Google Cloud
Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello enterprise.
Utilizza questa pagina per apprendere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.
Apprendi le nozioni di base dello sviluppo dell'AI generativa
Quando utilizzare l'AI generativa o l'AI tradizionale
Panoramica dello sviluppo di un'applicazione di AI generativa
Scegli l'infrastruttura per la tua applicazione di AI generativa
Scopri quali prodotti, framework e strumenti sono più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata su cloud includono:
- Hosting di applicazioni:esegui il calcolo per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
- Hosting di modelli:hosting scalabile e sicuro per un modello generativo.
- Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
- Soluzione di grounding: ancora l'output del modello a fonti di informazioni verificabili e aggiornate.
- Database:archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt tramite query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
- Spazio di archiviazione:archivia i file come immagini, video o frontend web statici. Potresti anche usare Storage per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivi in un database vettoriale.
Le sezioni seguenti illustrano ciascun componente per aiutarti a scegliere quali prodotti Google Cloud provare.
Infrastruttura di hosting delle applicazioni
Per iniziare:
Infrastruttura di hosting di modelli
Per iniziare:
Modello
Per iniziare:
- Gemini
- Codey
- Immagini
- incorporamento del testo
- Vertex AI Model Garden (modelli open source)
- HuggingFace Model Hub (modelli open source)
Grounding
Per garantire risposte informate e precise, può essere opportuno basare la tua applicazione di AI generativa con dati in tempo reale. Questa procedura è chiamata generazione avanzata di recupero (RAG).
Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre diverse soluzioni di database vettoriali, per diversi casi d'uso.
Nota:puoi anche iniziare a utilizzare database tradizionali (non vettoriali), semplicemente eseguendo una query su un database esistente, come Cloud SQL o Firestore, e utilizzando il risultato nel prompt del modello.
Per iniziare:
- Vertex AI Agent Builder (in precedenza Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vector Search (in precedenza Matching Engine)
- AlloyDB per PostgreSQL
- Cloud SQL
- BigQuery
Grounding con le API
Vertex AI Extensions (anteprima privata)
Componenti Langchain
Grounding in Vertex AI
Inizia a creare
Configura l'ambiente di sviluppo
Installa Google Cloud CLI
Installa l'estensione Cloud Code nel tuo IDE
Configura l'autenticazione
Configurazione di LangChain
Progettare prompt e valutare i modelli
Introduzione alla progettazione dei prompt
Vertex AI Studio
Esempi di prompt di IA generativa
Ideazione con modelli generativi su Vertex AI
Valutazione dei modelli in Vertex AI
Esempi di codice
Chatbot web: rispondere a domande sul Google Store
Impara a creare un chatbot di risposta alle domande basato sul web utilizzando Vertex AI Agent Builder e Firebase.
App di chat con Eventarc e Vertex AI
Impara a creare una semplice applicazione Python Flask che chiama un modello di base preaddestrato in Vertex AI.
Genera una campagna di marketing con Gemini
Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.
App di question answering con "Guida alle MLOps per i professionisti"
Scopri come utilizzare Vertex AI Search e LangChain per fondare i prompt dei modelli a una fonte di conoscenza verificabile (white paper Google Cloud).
Assistente richieste API Weather: chiamata di funzione con Gemini
Scopri come implementare le chiamate di funzione, il processo di utilizzo di un LLM per compilare un corpo di richiesta che puoi poi inviare a un'API esterna.
Assistente aeroportuale: app di recupero dei database di IA generativa
App di esempio per la generazione avanzata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).
Indicazioni per l'architettura e soluzioni di avvio rapido
Infrastruttura per un'applicazione di IA generativa con funzionalità RAG utilizzando Vertex AI
Utilizza questa architettura di riferimento per progettare l'infrastruttura per l'esecuzione di un'applicazione di IA generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando Vertex AI e AlloyDB per PostgreSQL.
Infrastruttura per un'applicazione di AI generativa con funzionalità RAG utilizzando GKE
Utilizza questa architettura di riferimento per progettare l'infrastruttura per eseguire un'applicazione di AI generativa con generazione di recupero (RAG, Retrieval-Augmented Generation) utilizzando GKE, Cloud SQL e strumenti open source come Ray, Hugging Face e LangChain.
Progetta l'archiviazione per i carichi di lavoro di AI e ML in Google Cloud
Questo documento fornisce indicazioni sulla progettazione su come utilizzare e integrare la varietà di opzioni di archiviazione offerte da Google Cloud per i principali carichi di lavoro AI e ML.
Soluzione di avvio rapido: riassunto di documenti
Esegui il deployment di un'applicazione di esempio con un solo clic per riassumere documenti lunghi con Vertex AI.
Soluzione di avvio rapido: RAG di IA generativa con Cloud SQL
Esegui il deployment di un'applicazione di esempio con un solo clic che utilizza incorporamenti vettoriali archiviati in Cloud SQL per migliorare l'accuratezza delle risposte da un'applicazione di chat.
Soluzione di avvio rapido: knowledge base di IA generativa
Esegui il deployment di un'applicazione di esempio con un solo clic che estrae le coppie domanda e risposta da un insieme di documenti, oltre a una pipeline che attiva l'applicazione quando viene caricato un documento.