Versionshinweise zur generativen KI für Vertex AI

Auf dieser Seite werden die Produktionsaktualisierungen für die Unterstützung der generativen für Vertex AI und Vertex AI Model Garden dokumentiert. Prüfen Sie diese Seite regelmäßig auf Hinweise zu neuen oder aktualisierten Features, Fehlerkorrekturen, bekannten Problemen und verworfenen Funktionen.

1. September 2023

Preisaktualisierung

Die Preise für text-bison wurden auf 0,0005 $ pro 1.000 Eingabe- und Ausgabezeichen reduziert. Weitere Informationen finden Sie unter Vertex AI-Preise.

29. August 2023

Neue Unterstützung von generativer KI für Vertex AI-Modelle und erweiterte Sprachunterstützung

Die Unterstützung der generativen KI für Vertex AI wurde aktualisiert. Sie beinhaltet neue Sprachmodellkandidaten (neueste Modelle), Sprachmodelle, die Eingabe- und Ausgabetokens von bis zu 32.000 unterstützen, und weitere unterstützte Sprachen. Weitere Informationen finden Sie unter Verfügbare Modelle und Modellversionen und Lebenszyklus.

Streamantworten von Modellen der generativen KI.

Die Unterstützung für das Streaming von Modellen der generativen KI ist jetzt allgemein verfügbar (GA). Nachdem Sie einen Prompt gesendet haben, gibt das Modell Antworttokens so zurück, wie sie generiert werden, anstatt auf die Verfügbarkeit der gesamten Ausgabe zu warten.

Unterstützte Modelle sind:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

Weitere Informationen finden Sie unter Antworten von Modellen der generativen KI streamen.

Modelloptimierung für das Modell text-bison ist jetzt allgemein verfügbar

Die Feinabstimmung des Modells text-bison mit überwachter Feinabstimmung (SFT) ist jetzt allgemein verfügbar (GA). Weitere Informationen finden Sie unter Textmodelle verfeinern.

Die Modellabstimmung für das Modell chat-bison ist jetzt in der Vorschau verfügbar

Sie können jetzt das überwachte Modell chat-bison mit überwachter Feinabstimmung optimieren. Dieses Feature befindet sich in der (Vorschau). Weitere Informationen finden Sie unter Textmodelle verfeinern.

Neues Einbettungsmodell in der Vorschau verfügbar

Die Unterstützung der generativen KI für Vertex AI-Nutzer kann nun Einbettungen mit einem neuen Modell erstellen, das mit einer Vielzahl von nicht englischsprachigen Sprachen trainiert wurde. Das Modell befindet sich in der (Vorschau).

  • textembedding-gecko-multilingual

Weitere Informationen finden Sie unter Texteinbettungen abrufen.

Imagen Themenabstimmung und Stilabstimmung jetzt allgemein verfügbar (GA)

Imagen in Vertex AI bietet jetzt die folgenden GA-Features:

  • Subject-Modellabstimmung (Standardabstimmung)*
  • Feinabstimmung des Stilmodells*

* Eingeschränkter Zugriff.

Weitere Informationen zu Imagen in Vertex AI oder zum Zugriff auf eingeschränktes GA finden Sie in der Übersicht zu Imagen in Vertex AI.

Bestärkendes Lernen durch die Feinabstimmung menschlichen Feedbacks (RLHF) für text-bison

Die Unterstützung der generativen KI für das Vertex AI-Textgenerierungsmodell (text-bison) unterstützt jetzt die RLHF-Abstimmung. Die RLHF-Abstimmungsfunktion befindet sich in der (Vorschau). Weitere Informationen finden Sie unter RLHF-Modelloptimierung verwenden.

Sprachunterstützung von Vertex AI Codey APIs

Vertex AI Codey APIs unterstützen jetzt zusätzliche Programmiersprachen. Weitere Informationen finden Sie unter Unterstützte Programmiersprachen.

Vertex AI Codey APIs unterstützen jetzt überwachte Feinabstimmung (SFT)

Die Code-Chats (codechat-bison) und die Codegenerierung (code-bison) von Vertex AI Codey APIs unterstützen jetzt überwachte Feinabstimmung (SFT). Die Überwachung der Feinabstimmung für die Modelle der Vertex AI Codey APIs befindet sich in der (Vorschau). Weitere Informationen finden Sie unter Codemodelle verfeinern.

Messwertbasierte Modellbewertung

Sie können die Leistung von Foundation Models und abgestimmten Modellen anhand eines Bewertungs-Datasets für die Klassifizierung, Zusammenfassung, Beantwortung von Fragen und allgemeine Textgenerierung bewerten. Dieses Feature ist in der (Vorschau) verfügbar.

Weitere Informationen finden Sie unter Modellleistung bewerten.

CountToken API ist jetzt in der Vorschau verfügbar

Die CountToken API ist jetzt verfügbar (Vorschau). Mit dieser API können Sie die Anzahl der Tokens und die Anzahl der abrechenbaren Zeichen für eine Eingabeaufforderung abrufen. Weitere Informationen finden Sie unter Tokenanzahl abrufen.

9. August 2023

Multimodale Image-Einbettungen in GA verfügbar

Imagen in Vertex AI bietet jetzt das folgende GA-Feature:

  • Multimodale Einbettungen

Diese Funktion berechnet unterschiedliche Preise, je nachdem, ob Sie die Bild- oder Texteingabe verwenden. Weitere Informationen dazu finden Sie auf der Seite Multimodale Einbettungen.

21. August 2023

Aktualisierung des Parameters zur Modellabstimmung

Modellabstimmungsjobs akzeptieren jetzt optionale Parameter für die Modellbewertung und die Einbindung von Vertex AI TensorBoard. So können Sie Ihr Modell bewerten und Visualisierungen mit einem einzigen Befehl generieren. Weitere Informationen finden Sie unter Modellabstimmungsjob erstellen.

28. Juli 2023

Aktualisierung des Parameters zur Modellabstimmung

Der Parameter learning_rate bei der Modellabstimmung ist jetzt learning_rate_multiplier. Wenn Sie die Standard-Lernrate des Modells oder der Feinabstimmungsmethode verwenden möchten, verwenden Sie den Standardwert learning_rate_multiplier von 1.0.

Wenn Sie learning_rate noch nicht konfiguriert haben, sind keine Maßnahmen erforderlich. Wenn Sie tuning_method=tune_v2 mit der Pipelinevorlage v2.0.0 (Python SDK v1.28.1+) verwenden, beträgt die empfohlene Lernrate 0,0002. Zum Konvertieren Ihres benutzerdefinierten learning_rate in learning_rate_multiplier berechnen Sie Folgendes:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

18. Juli 2023

Updates der Modelloptimierung für Text-bison

  • Die aktualisierte Abstimmungspipeline bietet jetzt eine effizientere Abstimmung und eine bessere Leistung für Text-bison.
  • Neue Abstimmungsregion (us-central1) mit GPU-Unterstützung verfügbar.
  • Mit dem neuen Parameter learning_rate können Sie die Schrittgröße bei jeder Iteration anpassen.

Weitere Informationen finden Sie unter Spracherkennungsmodelle vefeinern.

17. Juli 2023

Imagen auf allgemein verfügbaren Features von Vertex AI

Imagen in Vertex AI bietet jetzt die folgenden GA-Features:

* Eingeschränkter Zugriff.

Weitere Informationen zu Imagen oder zum Zugriff auf eingeschränkte GA- oder Vorschau-Features finden Sie in der Übersicht zu Imagen in Vertex AI.

Erstellung menschlicher Gesichter jetzt unterstützt

Imagen unterstützt jetzt das Erstellen von menschlichen Gesichtern für die folgenden Features:

* Eingeschränkter Zugriff.

Die Generierung von Gesichtern ist standardmäßig aktiviert, mit Ausnahme von Bildern mit Kinder und/oder Prominenten. Weitere Informationen finden Sie in den Nutzungsrichtlinien.

Unterstützung weiterer Sprachen

Die Vertex AI PaLM API unterstützt die folgenden Sprachen:

  • Spanisch (es)
  • Koreanisch (ko)
  • Hindi (hi)
  • Chinesisch (zh)

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Unterstützte Sprachen.

13. Juli 2023

Batch-Unterstützung für PaLM 2 für Text

Unterstützung für Batchtextanfragen (text-bison) ist jetzt in GA verfügbar. Sie können sich die Preise für das chat-bison-Modell auf der Seite Vertex AI – Preise ansehen.

10. Juli 2023

PaLM 2 für Chat

Unterstützung für Chat (chat-bison) ist jetzt in GA verfügbar. Sie können sich die Preise für das chat-bison-Modell auf der Seite Vertex AI – Preise ansehen.

29. Juni 2023

Vertex AI-Codey APIs

Vertex AI Codey APIs sind jetzt allgemein verfügbar (GA). Verwenden Sie die Vertex AI Codey APIs, um Lösungen mit Codegenerierung, Codevervollständigung und Codechat zu erstellen. Da die Vertex AI Codey APIs allgemein verfügbar sind, fallen möglicherweise Nutzungskosten an. Informationen zu Preisen finden Sie in der Preisübersicht für Generative AI auf Vertex AI.

Die Modelle in dieser Version umfassen:

  • code-bison (Codegenerierung)
  • codechat-bison (Codechat)
  • code-gecko (Codevervollständigung)

Die maximalen Tokens für die Eingabe wurden von 4.096 auf 6.144 Tokens für code-bison und codechat-bison erhöht, um längere Eingabeaufforderungen und das Chatprotokoll zu ermöglichen. Die maximale Tokenausgabe für die Ausgabe wurde von 1.024 auf 2.048 für code-bison und codechat-bison erhöht, um längere Antworten zu ermöglichen.

Es werden zusätzliche Programmiersprachen unterstützt. Weitere Informationen finden Sie unter Unterstützte Programmiersprachen.

Mehrere Feinabstimmungs-Datasets wurden aus den Modellen code-bison und codechat-bison entfernt, um die folgenden Verbesserungen zu implementieren:

  • Übertriebenes Gerede.
  • Artefakte, z. B. NBSP-Zeichen (nicht kompatible Leerzeichen).
  • Antworten mit niedriger Qualität.

Weitere Informationen zu Cloud-Horizontalen finden Sie unter Vertex AI-Zertifizierungen.

15. Juni 2023

PaLM 2 für Chat

Das Modell chat-bison wurde aktualisiert, um der Anleitung im Feld context besser zu folgen. Weitere Informationen zum Erstellen von Chataufforderungen für chat-bison finden Sie unter Chataufforderungen erstellen.

7. Juni 2023

PaLM Text- und Einbettungs-APIs und Generative AI Studio

Die generative AI-Unterstützung für Vertex AI ist jetzt in GA verfügbar. Mit diesem Feature können Sie die Vertex AI PaLM API nutzen, um KI-Modelle zu generieren, die Sie in Ihren KI-gestützten Anwendungen testen, optimieren und bereitstellen können. Da diese Features allgemein verfügbar sind, fallen Nutzungskosten an, wenn Sie die PaLM API text-bison und textembedding-gecko verwenden. Informationen zu Preisen finden Sie auf der Seite Vertex AI – Preise.

Zu den Features und Modellen in diesem Release gehören:

  • PaLM 2 für Text: text-bison
  • Einbettung für Text: textembedding-gecko
  • Generative AI Studio für Sprache

Model Garden

Model Garden ist jetzt in (GA) verfügbar. Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle auswählen können. Diese Modelle reichen von einstellbar bis aufgabenspezifisch und sind alle auf der Seite „Model Garden“ in der Google Cloud Console verfügbar.

Eine Einführung finden Sie unter KI-Modelle und APIs in Model Garden.

Vertex AI-Codey APIs

Die Vertex AI Codey APIs befinden sich jetzt (Vorschau). Mit den Codey APIs können die Codegenerierung, die Codevervollständigung und Code-Chat-APIs aus jedem Google Cloud-Projekt ohne Zulassungsliste verwendet werden. Auf die APIs kann in der Region us-central1 zugegriffen werden. Die Codey APIs können in Generative AI Studio oder programmatisch in REST-Befehlen verwendet werden.

Eine Einführung finden Sie in der Übersicht über Codemodelle.

10. Mai 2023

Unterstützung generativer KI in Vertex AI

Die Unterstützung der generativen KI für Vertex AI ist jetzt in der Vorschau verfügbar. Mit diesem Feature können Sie die Vertex AI PaLM API nutzen, um KI-Modelle zu generieren, die Sie testen, optimieren und in Ihren KI-gestützten Anwendungen bereitstellen können.

Zu den Features und Modellen in diesem Release gehören:

  • PaLM 2 für Text: text-bison
  • PaLM 2 für Chat: chat-bison
  • Einbettung für Text: textembedding-gecko
  • Generative AI Studio für Sprache
  • Feinabstimmung für PaLM 2
  • Vertex AI SDK Version 1.25 mit neuen Features wie TextGenerationModel (text-bison), ChatModel (chat-bison), TextEmbeddingModel (textembedding-gecko@001)

Sie können mit den Features für generative KI in Vertex AI interagieren. Dazu verwenden Sie Generative AI Studio in der Google Cloud Console, die Vertex AI API und das Vertex AI SDK für Python.

Model Garden

Model Garden ist jetzt verfügbar (Vorschau). Model Garden ist eine Plattform, mit der Sie Vertex AI ermitteln, testen, anpassen und bereitstellen sowie OSS-Modelle auswählen können. Diese Modelle reichen von einstellbaren bis aufgabenspezifischen Funktionen. Diese sind alle in der Google Cloud Console auf der Seite „Model Garden“ verfügbar.