Next '24 に参加されなかった方は、以下のすべてのセッションはオンデマンドでご覧いただけるようになっています。今すぐご覧ください。

統合型スーパーコンピューティングアーキテクチャ

AI ハイパーコンピュータ:

AI により最適化されたハードウェア、ソフトウェア、使用量の組み合わせにより、生産性と効率が向上。

概要

パフォーマンスが最適化されたハードウェア

Google Cloud TPU、Google Cloud GPU、Google Cloud Storage、基盤となる Jupiter ネットワークなどのパフォーマンス最適化インフラストラクチャを利用することで、アーキテクチャの優れたスケーリング特性によって最先端の大規模なモデルのトレーニングを一貫して最速で行うことができ、大規模モデルの提供において最良のコストパフォーマンスを実現できます。

Google Cloud TPU で LLM を強化

Google Cloud のカスタム設計された AI アクセラレータである Google Cloud TPU が LLM ワークロードのパフォーマンスを最適化する仕組みについて学習します。

オンデマンドで視聴

オープンソフトウェア

Google のアーキテクチャは、Tensorflow、Pytorch、JAX などの最も一般的なツールやライブラリをサポートするように最適化されています。さらに、Cloud TPU マルチスライスおよびマルチホスト構成などのテクノロジーや、Google Kubernetes Engine などのマネージドサービスも利用できます。これにより、SLURM によってオーケストレートされた NVIDIA NeMO フレームワークのような、一般的なワークロードにターンキーデプロイを実現できます。

GKE-Llama 2 以降におけるオープン LLM

GKE-Llama 2 以降で Open LLM を使用して、生成 AI プラットフォームのゲームをレベルアップする方法をご紹介します。

オンデマンドで視聴

柔軟な消費

Google の柔軟な利用モデルにより、お客様は確約利用割引付きの固定費用または動的なオンデマンドモデルを選択して、ビジネスニーズを満たすことができます。Dynamic Workload Scheduler を使用することで、お客様は過剰に割り当てることなく必要な容量だけを確保し、必要な分だけを支払うことができます。さらに、Google Cloud の費用最適化ツールを使用すると、リソースの使用を自動化してエンジニアの手作業を削減できます。

AI/ML ワークロードに向けてリソースへのアクセスと経済性を最適化する

Dynamic Workload Scheduler サービスが AI ワークロードの実行を最適化する方法を学習します。

ブログを読む

仕組み

Google は、TensorFlow などの技術の発明を使用する AI のリーダーです。ご自身のプロジェクトで Google のテクノロジーを利用できることをご存じですか？AI インフラストラクチャにおける Google のイノベーションの歴史と、それをワークロードに活用する方法を学びます。

オンデマンドで視聴

一般的な使用例

大規模な AI トレーニングの実行

強力かつスケーラブルで効率的な AI トレーニング

Cloud TPU マルチスライストレーニングは、数万個の TPU チップで高速かつ容易に信頼性の高い大規模な AI モデルのトレーニングを行えるフルスタックテクノロジーです。

マルチスライスで AI トレーニングを最大数万の Cloud TPU チップまでスケーリングする方法

AI トレーニングを最大数万の Cloud TPU チップまでスケーリング

参考情報

強力かつスケーラブルで効率的な AI トレーニング

Cloud TPU マルチスライストレーニングは、数万個の TPU チップで高速かつ容易に信頼性の高い大規模な AI モデルのトレーニングを行えるフルスタックテクノロジーです。

マルチスライスで AI トレーニングを最大数万の Cloud TPU チップまでスケーリングする方法

AI トレーニングを最大数万の Cloud TPU チップまでスケーリング

お客様の事例

Character AI は Google Cloud を活用してスケールアップを実現

「ユーザーのメッセージに対する回答を生成するには GPU が必要です。また、プラットフォームのユーザー数が増えるにつれ、それに応えるための GPU も増え続けています。そのため、Google Cloud では、特定のワークロードに適したプラットフォームを見つけるためにテストを実施することができます。最も価値のあるソリューションを柔軟に選択できることは素晴らしいことです。」 Character.AI、創設エンジニア、Myle Ott 氏

今すぐ見る。

1:36

AI を活用したアプリケーションの提供

オープンフレームワークを活用して AI を活用したエクスペリエンスを提供

Google Cloud のオープンソフトウェアエコシステムでは、使い慣れたツールとフレームワークでアプリケーションを構築しながら、AI ハイパーコンピュータアーキテクチャのコストパフォーマンスのメリットを活用できます。

フルマネージド GKE での AI の実行

参考情報

オープンフレームワークを活用して AI を活用したエクスペリエンスを提供

Google Cloud のオープンソフトウェアエコシステムでは、使い慣れたツールとフレームワークでアプリケーションを構築しながら、AI ハイパーコンピュータアーキテクチャのコストパフォーマンスのメリットを活用できます。

フルマネージド GKE での AI の実行

お客様の事例

Priceline: 旅行者がユニークな体験をキュレートできるよう支援

現在は、Google Cloud を使って生成 AI を組み込むことで、chatbot 内に独自の旅行コンシェルジュを作成できます。お客様に旅行の計画という枠を超えていただけるよう、ユニークな旅行体験のキュレートをサポートしています。」Priceline、CTO、Martin Brodbeck 氏

詳細

費用対効果に優れた大規模なモデルサービング

AI を大規模に提供してコストパフォーマンスを最大化する

NVIDIA L4 GPU を提供する Cloud TPU v5e および G2 VM インスタンスにより、最新の LLM や生成 AI モデルなどの幅広い AI ワークロードに対して、高パフォーマンスで費用対効果の高い推論が可能になります。どちらも、以前のモデルよりもコストパフォーマンスが大幅に向上します。また、Google Cloud の AI ハイパーコンピュータアーキテクチャにより、お客様はデプロイを業界をリードするレベルにスケーリングできます。

Cloud TPU v5e が大規模な AI 推論を高速化

参考情報

AI を大規模に提供してコストパフォーマンスを最大化する

NVIDIA L4 GPU を提供する Cloud TPU v5e および G2 VM インスタンスにより、最新の LLM や生成 AI モデルなどの幅広い AI ワークロードに対して、高パフォーマンスで費用対効果の高い推論が可能になります。どちらも、以前のモデルよりもコストパフォーマンスが大幅に向上します。また、Google Cloud の AI ハイパーコンピュータアーキテクチャにより、お客様はデプロイを業界をリードするレベルにスケーリングできます。

Cloud TPU v5e が大規模な AI 推論を高速化

お客様の事例

Assembly AI は Google Cloud を活用して費用対効果を改善

「テストの結果、モデルの大規模な推論を実行する場合に最も費用対効果が高かったアクセラレータは Cloud TPU v5e であることが判明しました。G2 インスタンスに比べて 1 ドルあたり 2.7 倍のパフォーマンスを、A2 インスタンスに比べて 1 ドルあたり 4.2 倍のパフォーマンスを達成しました」Domenic Donato 氏

AssemblyAI、テクノロジー担当バイスプレジデント

詳細

ライターが Google Cloud GPU で AI ソリューションを効率的に提供

Google Cloud 上のオープンソースモデル

統合型スーパーコンピューティング アーキテクチャ

AI ハイパーコンピュータ:

AI リーダーシップ

パフォーマンスが最適化されたハードウェア

オープン ソフトウェア

柔軟な消費

大規模な AI トレーニングの実行

強力かつスケーラブルで効率的な AI トレーニング

Character AI は Google Cloud を活用してスケールアップを実現

参考情報

強力かつスケーラブルで効率的な AI トレーニング

お客様の事例

Character AI は Google Cloud を活用してスケールアップを実現

AI を活用したアプリケーションの提供

オープン フレームワークを活用して AI を活用したエクスペリエンスを提供

Priceline: 旅行者がユニークな体験をキュレートできるよう支援

参考情報

オープン フレームワークを活用して AI を活用したエクスペリエンスを提供

お客様の事例

Priceline: 旅行者がユニークな体験をキュレートできるよう支援

費用対効果に優れた大規模なモデル サービング

AI を大規模に提供してコスト パフォーマンスを最大化する

Assembly AI は Google Cloud を活用して費用対効果を改善

参考情報

AI を大規模に提供してコスト パフォーマンスを最大化する

お客様の事例

Assembly AI は Google Cloud を活用して費用対効果を改善

Google Cloud 上のオープンソース モデル

単一の GPU で GKE を使用してモデルを提供する

GPU を使用して一般的なモデルをトレーニングする

複数の GPU へのモデルのサービングをスケールする

GKE で Saxml を実行してマルチホスト TPU を使用して LLM を提供する

NVIDIA Nemo フレームワークを使用して大規模にトレーニングする

統合型スーパーコンピューティングアーキテクチャ

オープンソフトウェア

オープンフレームワークを活用して AI を活用したエクスペリエンスを提供

オープンフレームワークを活用して AI を活用したエクスペリエンスを提供

費用対効果に優れた大規模なモデルサービング

AI を大規模に提供してコストパフォーマンスを最大化する

AI を大規模に提供してコストパフォーマンスを最大化する

Google Cloud 上のオープンソースモデル