SRE の新しいホワイトペーパーをダウンロードして、主要な概念と、Google Cloud が SRE 実装の道のりでどのように役立つかについて学びます

サイト信頼性エンジニアリング(SRE)

SRE は、信頼性の高い本番環境システムを実行するための職務、マインドセット、エンジニアリング手法のセットです。Google Cloud では、ツールやプロフェッショナル サービスなどのリソースを通じて、SRE の原則を実装できるよう支援しています。

  • Sabre
  • Lowe’s
  • ADEO
  • Zebra
  • Optiva
  • Proctor & Gamble
  • TELUS
  • Ulta
  • JCB ロゴ

利点

スピードと信頼性のバランスを取る

スピードのメリットを引き出す

コードの記述から本番環境でのサービスの実行まで、エンドツーエンドの自動化を実現します。開発と運用を共通の目標に合わせて調整し、高速化します。卜イルを最小限に抑えながら、インシデント管理などの使い慣れたツールに接続できます。

実績のある SRE の原則に従って信頼性を向上

Google が開発し、大規模な運用が実証された SRE の原則を利用できます。Google Cloud のオブザーバビリティで SRE のベスト プラクティスを簡単に実装して、問題解決の迅速と信頼性の向上を実現できます。

SRE 導入のどの段階にいても Google が支援

会社の規模や業種、また VM、Kubernetes、サーバーレスのいずれを使用しているかにかかわらず、ソフトウェア デリバリーを向上させます。無料ツールや有料サービスから選択して、SRE の構築をすぐに開始できます。

主な機能

運用チームと SRE チームのパフォーマンスを向上させる SRE のツールとリソース

SRE の原則を使用したサービスの健全性のモニタリング

サービスの健全性をモニタリングし、デベロッパーと協力して、サービスのモニタリングの組み込みサポートを使用して変更の速度を高めます。SLI の指標の選択、SLO の設定、エラー バジェットの追跡を行い、サービスのリスクを軽減します。パワフルなダッシュボードを使用して、ゴールデン シグナルを含む指標やログを集約し、MTTR を短縮すれば、サービスの健全性に関する質問に迅速に回答できます。

すぐに使用できる統合により自動化を促進し卜イルを削減

使い慣れたツールとの統合機能が組み込まれているため、インシデントを迅速にトラブルシューティングできます。段階的なロールアウトを実装し、変更を安全にロールバックします。Cloud Build との事前構築された統合を利用して、アーティファクトを Google Kubernetes EngineApp EngineCloud FunctionsFirebaseCloud Run に対して、CI / CD の一部として構築、テスト、デプロイできます。

1 つの統合ビューで問題を迅速に解決

ログ、イベント、指標、SLO をまとめた 1 つのビューを表示できます。Google Kubernetes EngineCloud RunCompute EngineAnthos、その他のランタイムのサービス コンソール内で、インコンテキスト オブザーバビリティ データを取得できます。設定なしで指標、トレース、ログを収集できます。1 秒未満の取り込みレイテンシと 1 秒あたりテラバイトの取り込み速度により、リアルタイムのログ管理と大規模な分析を実行できます。

Google Cloud SRE スペシャリストからのサポートを受ける

プロセス全体を通じて実践的なサポートを受けたい場合は、Google コンサルティング サービスなどの追加サービスをご検討ください。お客様の組織に適したオプションについては、営業担当者にお問い合わせください。Google の CRE チームとお客様の成功事例から、Google Cloud のツールとプラクティスが他の企業における SRE の実装にどのように役立っているかをご確認ください。

SRE / デベロッパーのコラボレーションを促進して「シフトレフト」オブザーバビリティを実現

OpenTelemetry(OT)パッケージと Google エクスポータを使用することで、デベロッパーはトレースデータを Cloud Trace にインストゥルメント化してエクスポートできます。新しい統合 Ops エージェント(プレビュー中)は、指標とログを収集するとともに、OpenTelemetry をサポートして、指標の取得と転送を行います。Google では、多くのクラウド プロダクトに、OT ライブラリをすぐに使用できる機能として実装する作業を進めています。Cloud SQL Insights はこの取り組みの一例です。

ドキュメント

組織に SRE を実装する方法については以下のリソースをご参照ください

ベスト プラクティス

Google のサイト信頼性エンジニアリング

SRE ブックにアクセスし、SRE から話を聞き、Google の SRE の手法について学びます。
Google Cloud の基礎

SLO の作成

サービスをモニタリングするには、サービスレベル目標(SLO)が少なくとも 1 つ必要です。 Cloud Monitoring で最初の SLO を作成する方法を順を追って確認します。
チュートリアル

信頼性のためのエンジニアリング

Google Cloud のオブザーバビリティで SLO を定義して保護し、Google Cloud で実行されているアプリケーションのオブザーバビリティを向上させる方法を学習します。
チュートリアル

SRE: 信頼性の測定と管理

このコースでは、サービスレベル目標(SLO)の理論について説明します。SLO とは、目標とするサービスの信頼性を記述および測定するための、原則的な方法です。
チュートリアル

Developing a Google SRE Culture

このコースでは、Google の SRE の主な手法を紹介し、SRE の組織的な導入を成功させるうえで IT リーダーとビジネス リーダーが果たす重要な役割について説明します。

お探しのものが見つからない場合

最新情報

Google Cloud SRE の新機能

Google Cloud のニュースレターにご登録いただくと、プロダクトの最新情報、イベント情報、特典のお知らせなどが配信されます。

次のステップ

問題点をお知らせください。Google Cloud のエキスパートが、最適なソリューションを見つけるお手伝いをいたします。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
Google Cloud