Auf dieser Seite werden die Produktionsaktualisierungen für die Unterstützung der generativen für Vertex AI und Vertex AI Model Garden dokumentiert. Prüfen Sie diese Seite regelmäßig auf Hinweise zu neuen oder aktualisierten Features, Fehlerkorrekturen, bekannten Problemen und verworfenen Funktionen.
1. September 2023
Preisaktualisierung
Die Preise für text-bison
wurden auf 0,0005 $ pro 1.000 Eingabe- und Ausgabezeichen reduziert. Weitere Informationen finden Sie unter Vertex AI-Preise.
29. August 2023
Neue Unterstützung von generativer KI für Vertex AI-Modelle und erweiterte Sprachunterstützung
Die Unterstützung der generativen KI für Vertex AI wurde aktualisiert. Sie beinhaltet neue Sprachmodellkandidaten (neueste Modelle), Sprachmodelle, die Eingabe- und Ausgabetokens von bis zu 32.000 unterstützen, und weitere unterstützte Sprachen. Weitere Informationen finden Sie unter Verfügbare Modelle und Modellversionen und Lebenszyklus.
Streamantworten von Modellen der generativen KI.
Die Unterstützung für das Streaming von Modellen der generativen KI ist jetzt allgemein verfügbar (GA). Nachdem Sie einen Prompt gesendet haben, gibt das Modell Antworttokens so zurück, wie sie generiert werden, anstatt auf die Verfügbarkeit der gesamten Ausgabe zu warten.
Unterstützte Modelle sind:
text-bison
chat-bison
code-bison
codechat-bison
Weitere Informationen finden Sie unter Antworten von Modellen der generativen KI streamen.
Modelloptimierung für das Modell text-bison
ist jetzt allgemein verfügbar
Die Feinabstimmung des Modells text-bison
mit überwachter Feinabstimmung (SFT) ist jetzt allgemein verfügbar (GA).
Weitere Informationen finden Sie unter Textmodelle verfeinern.
Die Modellabstimmung für das Modell chat-bison
ist jetzt in der Vorschau verfügbar
Sie können jetzt das überwachte Modell chat-bison
mit überwachter Feinabstimmung optimieren. Dieses Feature befindet sich in der (Vorschau).
Weitere Informationen finden Sie unter Textmodelle verfeinern.
Neues Einbettungsmodell in der Vorschau verfügbar
Die Unterstützung der generativen KI für Vertex AI-Nutzer kann nun Einbettungen mit einem neuen Modell erstellen, das mit einer Vielzahl von nicht englischsprachigen Sprachen trainiert wurde. Das Modell befindet sich in der (Vorschau).
textembedding-gecko-multilingual
Weitere Informationen finden Sie unter Texteinbettungen abrufen.
Imagen Themenabstimmung und Stilabstimmung jetzt allgemein verfügbar (GA)
Imagen in Vertex AI bietet jetzt die folgenden GA-Features:
- Subject-Modellabstimmung (Standardabstimmung)*
- Feinabstimmung des Stilmodells*
* Eingeschränkter Zugriff.
Weitere Informationen zu Imagen in Vertex AI oder zum Zugriff auf eingeschränktes GA finden Sie in der Übersicht zu Imagen in Vertex AI.
Bestärkendes Lernen durch die Feinabstimmung menschlichen Feedbacks (RLHF) für text-bison
Die Unterstützung der generativen KI für das Vertex AI-Textgenerierungsmodell (text-bison
) unterstützt jetzt die RLHF-Abstimmung. Die RLHF-Abstimmungsfunktion befindet sich in der (Vorschau).
Weitere Informationen finden Sie unter RLHF-Modelloptimierung verwenden.
Sprachunterstützung von Vertex AI Codey APIs
Vertex AI Codey APIs unterstützen jetzt zusätzliche Programmiersprachen. Weitere Informationen finden Sie unter Unterstützte Programmiersprachen.
Vertex AI Codey APIs unterstützen jetzt überwachte Feinabstimmung (SFT)
Die Code-Chats (codechat-bison
) und die Codegenerierung (code-bison
) von Vertex AI Codey APIs unterstützen jetzt überwachte Feinabstimmung (SFT). Die Überwachung der Feinabstimmung für die Modelle der Vertex AI Codey APIs befindet sich in der (Vorschau).
Weitere Informationen finden Sie unter Codemodelle verfeinern.
Messwertbasierte Modellbewertung
Sie können die Leistung von Foundation Models und abgestimmten Modellen anhand eines Bewertungs-Datasets für die Klassifizierung, Zusammenfassung, Beantwortung von Fragen und allgemeine Textgenerierung bewerten. Dieses Feature ist in der (Vorschau) verfügbar.
Weitere Informationen finden Sie unter Modellleistung bewerten.
CountToken API ist jetzt in der Vorschau verfügbar
Die CountToken API ist jetzt verfügbar (Vorschau). Mit dieser API können Sie die Anzahl der Tokens und die Anzahl der abrechenbaren Zeichen für eine Eingabeaufforderung abrufen. Weitere Informationen finden Sie unter Tokenanzahl abrufen.
9. August 2023
Multimodale Image-Einbettungen in GA verfügbar
Imagen in Vertex AI bietet jetzt das folgende GA-Feature:
- Multimodale Einbettungen
Diese Funktion berechnet unterschiedliche Preise, je nachdem, ob Sie die Bild- oder Texteingabe verwenden. Weitere Informationen dazu finden Sie auf der Seite Multimodale Einbettungen.
21. August 2023
Aktualisierung des Parameters zur Modellabstimmung
Modellabstimmungsjobs akzeptieren jetzt optionale Parameter für die Modellbewertung und die Einbindung von Vertex AI TensorBoard. So können Sie Ihr Modell bewerten und Visualisierungen mit einem einzigen Befehl generieren. Weitere Informationen finden Sie unter Modellabstimmungsjob erstellen.
28. Juli 2023
Aktualisierung des Parameters zur Modellabstimmung
Der Parameter learning_rate
bei der Modellabstimmung ist jetzt learning_rate_multiplier
.
Wenn Sie die Standard-Lernrate des Modells oder der Feinabstimmungsmethode verwenden möchten, verwenden Sie den Standardwert learning_rate_multiplier
von 1.0
.
Wenn Sie learning_rate
noch nicht konfiguriert haben, sind keine Maßnahmen erforderlich.
Wenn Sie tuning_method=tune_v2
mit der Pipelinevorlage v2.0.0 (Python SDK v1.28.1+) verwenden, beträgt die empfohlene Lernrate 0,0002. Zum Konvertieren Ihres benutzerdefinierten learning_rate
in learning_rate_multiplier
berechnen Sie Folgendes:
learing_rate_multiplier = custom_learning_rate_value / 0.0002
18. Juli 2023
Updates der Modelloptimierung für Text-bison
- Die aktualisierte Abstimmungspipeline bietet jetzt eine effizientere Abstimmung und eine bessere Leistung für Text-bison.
- Neue Abstimmungsregion (
us-central1
) mit GPU-Unterstützung verfügbar. - Mit dem neuen Parameter
learning_rate
können Sie die Schrittgröße bei jeder Iteration anpassen.
Weitere Informationen finden Sie unter Spracherkennungsmodelle vefeinern.
17. Juli 2023
Imagen auf allgemein verfügbaren Features von Vertex AI
Imagen in Vertex AI bietet jetzt die folgenden GA-Features:
- Image-Generierung (Text-zu-Image-Generierung)*
- Bildbearbeitung*
- Visuelle Untertitel in Bildern
- Visual Question Answering (VQA)
* Eingeschränkter Zugriff.
Weitere Informationen zu Imagen oder zum Zugriff auf eingeschränkte GA- oder Vorschau-Features finden Sie in der Übersicht zu Imagen in Vertex AI.
Erstellung menschlicher Gesichter jetzt unterstützt
Imagen unterstützt jetzt das Erstellen von menschlichen Gesichtern für die folgenden Features:
* Eingeschränkter Zugriff.
Die Generierung von Gesichtern ist standardmäßig aktiviert, mit Ausnahme von Bildern mit Kinder und/oder Prominenten. Weitere Informationen finden Sie in den Nutzungsrichtlinien.
Unterstützung weiterer Sprachen
Die Vertex AI PaLM API unterstützt die folgenden Sprachen:
- Spanisch (es)
- Koreanisch (ko)
- Hindi (hi)
- Chinesisch (zh)
Eine vollständige Liste der unterstützten Sprachen finden Sie unter Unterstützte Sprachen.
13. Juli 2023
Batch-Unterstützung für PaLM 2 für Text
Unterstützung für Batchtextanfragen (text-bison
) ist jetzt in GA verfügbar.
Sie können sich die Preise für das chat-bison
-Modell auf der Seite Vertex AI – Preise ansehen.
10. Juli 2023
PaLM 2 für Chat
Unterstützung für Chat (chat-bison
) ist jetzt in GA verfügbar.
Sie können sich die Preise für das chat-bison
-Modell auf der Seite Vertex AI – Preise ansehen.
29. Juni 2023
Vertex AI-Codey APIs
Vertex AI Codey APIs sind jetzt allgemein verfügbar (GA). Verwenden Sie die Vertex AI Codey APIs, um Lösungen mit Codegenerierung, Codevervollständigung und Codechat zu erstellen. Da die Vertex AI Codey APIs allgemein verfügbar sind, fallen möglicherweise Nutzungskosten an. Informationen zu Preisen finden Sie in der Preisübersicht für Generative AI auf Vertex AI.
Die Modelle in dieser Version umfassen:
code-bison
(Codegenerierung)codechat-bison
(Codechat)code-gecko
(Codevervollständigung)
Die maximalen Tokens für die Eingabe wurden von 4.096 auf 6.144 Tokens für code-bison
und codechat-bison
erhöht, um längere Eingabeaufforderungen und das Chatprotokoll zu ermöglichen. Die maximale Tokenausgabe für die Ausgabe wurde von 1.024 auf 2.048 für code-bison
und codechat-bison
erhöht, um längere Antworten zu ermöglichen.
Es werden zusätzliche Programmiersprachen unterstützt. Weitere Informationen finden Sie unter Unterstützte Programmiersprachen.
Mehrere Feinabstimmungs-Datasets wurden aus den Modellen code-bison
und codechat-bison
entfernt, um die folgenden Verbesserungen zu implementieren:
- Übertriebenes Gerede.
- Artefakte, z. B. NBSP-Zeichen (nicht kompatible Leerzeichen).
- Antworten mit niedriger Qualität.
Weitere Informationen zu Cloud-Horizontalen finden Sie unter Vertex AI-Zertifizierungen.
15. Juni 2023
PaLM 2 für Chat
Das Modell chat-bison
wurde aktualisiert, um der Anleitung im Feld context
besser zu folgen. Weitere Informationen zum Erstellen von Chataufforderungen für chat-bison
finden Sie unter Chataufforderungen erstellen.
7. Juni 2023
PaLM Text- und Einbettungs-APIs und Generative AI Studio
Die generative AI-Unterstützung für Vertex AI ist jetzt in GA verfügbar.
Mit diesem Feature können Sie die Vertex AI PaLM API nutzen, um KI-Modelle zu generieren, die Sie in Ihren KI-gestützten Anwendungen testen, optimieren und bereitstellen können.
Da diese Features allgemein verfügbar sind, fallen Nutzungskosten an, wenn Sie die PaLM API text-bison
und textembedding-gecko
verwenden. Informationen zu Preisen finden Sie auf der Seite Vertex AI – Preise.
Zu den Features und Modellen in diesem Release gehören:
- PaLM 2 für Text:
text-bison
- Einbettung für Text:
textembedding-gecko
- Generative AI Studio für Sprache
Model Garden
Model Garden ist jetzt in (GA) verfügbar. Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle auswählen können. Diese Modelle reichen von einstellbar bis aufgabenspezifisch und sind alle auf der Seite „Model Garden“ in der Google Cloud Console verfügbar.
Eine Einführung finden Sie unter KI-Modelle und APIs in Model Garden.
Vertex AI-Codey APIs
Die Vertex AI Codey APIs befinden sich jetzt (Vorschau).
Mit den Codey APIs können die Codegenerierung, die Codevervollständigung und Code-Chat-APIs aus jedem Google Cloud-Projekt ohne Zulassungsliste verwendet werden. Auf die APIs kann in der Region us-central1
zugegriffen werden. Die Codey APIs können in Generative AI Studio oder programmatisch in REST-Befehlen verwendet werden.
Eine Einführung finden Sie in der Übersicht über Codemodelle.
10. Mai 2023
Unterstützung generativer KI in Vertex AI
Die Unterstützung der generativen KI für Vertex AI ist jetzt in der Vorschau verfügbar. Mit diesem Feature können Sie die Vertex AI PaLM API nutzen, um KI-Modelle zu generieren, die Sie testen, optimieren und in Ihren KI-gestützten Anwendungen bereitstellen können.
Zu den Features und Modellen in diesem Release gehören:
- PaLM 2 für Text:
text-bison
- PaLM 2 für Chat:
chat-bison
- Einbettung für Text:
textembedding-gecko
- Generative AI Studio für Sprache
- Feinabstimmung für PaLM 2
- Vertex AI SDK Version 1.25 mit neuen Features wie TextGenerationModel (
text-bison
), ChatModel (chat-bison
), TextEmbeddingModel (textembedding-gecko@001
)
Sie können mit den Features für generative KI in Vertex AI interagieren. Dazu verwenden Sie Generative AI Studio in der Google Cloud Console, die Vertex AI API und das Vertex AI SDK für Python.
- Unterstützung der generativen Ki für Vertex AI.
- Einführung in Generative AI Studio
- Erste Schritte mit einer Generative AI Studio-Kurzanleitung.
Model Garden
Model Garden ist jetzt verfügbar (Vorschau). Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle auswählen können. Diese Modelle reichen von einstellbaren bis aufgabenspezifischen Funktionen. Diese sind alle in der Google Cloud Console auf der Seite „Model Garden“ verfügbar.