マルチクラウドデータベース管理: アーキテクチャ、ユースケース、ベストプラクティス

Last reviewed 2022-10-28 UTC

このドキュメントでは、マルチクラウドデータベース管理用のデプロイアーキテクチャ、ユースケース、ベストプラクティスについて説明します。これは、複数のクラウド内とクラウド間でステートフルアプリケーションを設計、実装するアーキテクトとエンジニアを対象としています。

データベースにアクセスするマルチクラウドアプリケーションのアーキテクチャは、ユースケースによって異なります。すべてのマルチクラウドのユースケースをサポートできる単一のステートフルアプリケーションアーキテクチャはありません。たとえば、クラウドバーストのユースケースに最適なデータベースソリューションは、複数のクラウド環境で同時に実行されるアプリケーションに最適なデータベースソリューションとは異なります。

Google Cloud などのパブリッククラウドの場合は、特定のマルチクラウドユースケースに適したさまざまなデータベーステクノロジーがあります。単一のパブリッククラウド内の複数のリージョンにアプリケーションをデプロイする方法の一つに、Spanner などのパブリッククラウドのプロバイダが管理するマルチリージョンデータベースを使用するというものがあります。アプリケーションをパブリッククラウド間で移植可能にデプロイするには、PostgreSQL などのプラットフォームに依存しないデータベースをおすすめします。

このドキュメントでは、ステートフルデータベースアプリケーションの定義を紹介し、引き続きマルチクラウドデータベースのユースケース分析を紹介します。次に、ユースケースに基づいて、マルチクラウドデプロイアーキテクチャ用の詳細なデータベースシステムの分類を紹介します。

また、このドキュメントでは、適切なデータベーステクノロジー選択のための重要な決定事項を概説するデータベース選択のためのディシジョンツリーも紹介します。マルチクラウドデータベース管理のベストプラクティスに関する説明で締めくくります。

主な用語と定義

このセクションでは、このドキュメントで使用する、一般的なステートフルデータベースアプリケーションの用語と定義を提示します。

用語

パブリッククラウド。パブリッククラウドには、お客様が本番環境ワークロードを実行するために使用できるマルチテナントインフラストラクチャ（通常はグローバル）とサービスが用意されています。Google Cloud は、GKE、GKE Enterprise、マネージドデータベースなどの多くのマネージドサービスを備えたパブリッククラウドです。
ハイブリッドクラウド。ハイブリッドクラウドは、パブリッククラウドと 1 つ以上のオンプレミスデータセンターを組み合わせたものです。ハイブリッドクラウドのお客様は、オンプレミスサービスを、パブリッククラウドによって提供される追加サービスと組み合わせることができます。
マルチクラウド。マルチクラウドは、複数のパブリッククラウドとオンプレミスデータセンターを組み合わせたものです。ハイブリッドクラウドはマルチクラウドの一種です。
デプロイの場所。インフラストラクチャの場所は、アプリケーションとデータベースを含むワークロードをデプロイして実行できる物理的な場所です。たとえば、Google Cloud ではデプロイの場所はゾーンとリージョンです。抽象レベルでは、パブリッククラウドのリージョンまたはゾーンとオンプレミスのデータセンターがデプロイの場所です。

ステートフルデータベースアプリケーション

マルチクラウドのユースケースを定義するために、このドキュメントでは、次の図に示すように、汎用のステートフルデータベースアプリケーションアーキテクチャを使用しています。

ステートフルアプリケーションアーキテクチャの略図。

この図は次のコンポーネントを示しています。

データベース。データベースは、単一インスタンス、複数インスタンス、または分散データベースで、コンピューティングノードにデプロイされているか、クラウドマネージドサービスとして使用できます。
アプリケーションサービス。これらのサービスを組み合わせて、ビジネスロジックが実装されます。アプリケーションサービスは次のいずれかです。
- Kubernetes のマイクロサービス。
- 1 つ以上の仮想マシンで実行される粗粒度のプロセス。
- 1 つの大規模仮想マシン上のモノリシックアプリケーション。
- Cloud Functions または Cloud Run のサーバーレスコード。一部のアプリケーションサービスはデータベースにアクセスできます。それぞれのアプリケーションサービスを複数回デプロイできます。アプリケーションサービスの各デプロイは、そのアプリケーションサービスのインスタンスです。
アプリケーションクライアント。アプリケーションクライアントは、アプリケーションサービスによって提供される機能にアクセスします。アプリケーションクライアントは次のいずれかです。
- デプロイされたクライアント。コードはマシン、ノートパソコン、またはスマートフォン上で実行されます。
- デプロイされていないクライアント。クライアントコードはブラウザで実行されます。アプリケーションクライアントインスタンスは、常に 1 つ以上のアプリケーションサービスインスタンスにアクセスします。

マルチクラウドデータベースを説明するコンテキストでは、ステートフルアプリケーションのアーキテクチャを抽象化して、データベース、アプリケーションサービス、アプリケーションクライアントという要素を使って表現します。アプリケーションの実装においては、オペレーティングシステムやプログラミング言語の使用といった要因が異なる可能性がありますが、これらの細部はマルチクラウドデータベースの管理には影響しません。

データストレージサービスとしてのキューとファイル

アプリケーションサービスのデータを永続化するための永続リソースは数多く存在します。たとえば、データベース、キュー、ファイルなどです。各永続リソースは、ストレージデータモデルとそれらのモデル固有のアクセスパターンを提供します。アプリケーションではキュー、メッセージングシステム、ファイルシステムが使用されますが、次のセクションでは特にデータベースに焦点を当てます。

デプロイの場所、状態の共有、マルチクラウドデータベースの同期レプリケーションと非同期レプリケーションなどの要素については、キューとファイルにも同じ考慮事項が適用されますが、このドキュメントでは説明しません。

ネットワーキング

抽象化したステートフルアプリケーションアーキテクチャ（次の図に再掲）では、コンポーネント間の各矢印はネットワーク接続（たとえば、アプリケーションサービスにアクセスするアプリケーションクライアント）の通信関係を表します。

ステートフルアプリケーションアーキテクチャの略図。

接続はゾーン内、ゾーン間、リージョン間、クラウド間でも行えます。デプロイのロケーション間を任意の組み合わせで接続できます。マルチクラウド環境では、クラウド間のネットワーキングは重要な考慮事項であり、使用できるオプションがいくつかあります。クラウド間のネットワーキングの詳細については、Google Cloud への接続: お客様のネットワークオプションの説明をご覧ください。

このドキュメントのユースケースでは、次のことを前提としています。

クラウド間に安全なネットワーク接続が存在する。
データベースとそれらのコンポーネントは相互に通信できる。

機能面以外の観点では、ネットワークのサイズ、つまりスループットとレイテンシは、データベースのレイテンシとスループットに影響する可能性があります。機能の観点からは、ネットワーキングは通常、影響を与えません。

マルチクラウドデータベースのユースケース

このセクションでは、マルチクラウドデータベース管理の一般的なユースケースを示します。これらのユースケースでは、クラウドとデータベースノードの間に安全なネットワーク接続があることを前提としています。

アプリケーションの移行

マルチクラウドデータベース管理のコンテキストにおけるアプリケーション移行とは、アプリケーション、すべてのアプリケーションサービス、データベースを現在のクラウドからターゲットクラウドへ移行することを指します。企業がアプリケーションの移行を決定する際には、クラウドプロバイダと競合する状態を回避する、テクノロジーをモダナイズする、総所有コスト（TCO）を削減するためなど、多くの理由が存在します。

アプリケーションの移行では、現行のクラウドで本番環境を停止し、移行が完了した後に移行先のクラウドで本番環境を続行します。アプリケーションサービスは、移行先のクラウドで実行する必要があります。サービスを実装するには、リフト＆シフト方式を使用できます。このアプローチでは、同じコードが移行先のクラウドにデプロイされます。サービスを再実装するために、移行先のクラウドで使用できる最新のクラウドテクノロジーを使用できます。

データベースの観点から、アプリケーションの移行に関して次の代替選択肢を検討してください。

データベースのリフト&シフト: ターゲットクラウドで同じデータベースエンジンが使用可能な場合は、データベースをリフト&シフトして、ターゲットクラウドに同じデプロイを作成できます。
データベースのリフトと同等のマネージドサービスへの移行: ターゲットクラウドで提供される場合、セルフマネージドデータベースは、同じデータベースエンジンのマネージドバージョンに移行できます。
データベースのモダナイゼーション: 用意されているデータベーステクノロジーはクラウドごとに異なります。クラウドプロバイダが管理するデータベースには、より厳格なサービスレベル契約（SLA）、スケーラビリティ、自動障害復旧などの利点がある場合が考えられます。

デプロイ戦略に関係なく、データベースの移行は、現行のクラウドから移行先のクラウドにデータを移動させる必要があるため、時間がかかるプロセスです。ダウンタイムが発生するエクスポートとインポートのアプローチを採用することは可能ですが、移行時のダウンタイムを最小限またはゼロにすることをおすすめします。このアプローチは、アプリケーションのダウンタイムをできる限り少なくして、企業とその顧客への影響を最小限に抑えます。

障害復旧

障害復旧とは、リージョンで停止が発生してもアプリケーションクライアントへのサービスを提供し続けることです。障害復旧を確実に行うには、アプリケーションを 2 つ以上のリージョンにデプロイし、いつでも実行できる状態にしておく必要があります。本番環境では、アプリケーションはプライマリリージョンで実行されます。ただし、アプリケーションの停止が発生した場合、セカンダリリージョンがプライマリリージョンになります。以下は、障害復旧への即応能力モデルを示します。

ホットスタンバイ。アプリケーションは複数のリージョン（プライマリとセカンダリ）にデプロイされ、すべてのリージョンでアプリケーションが完全に機能します。プライマリリージョンに障害が発生した場合は、セカンダリリージョンのアプリケーションが即座にアプリケーションクライアントのトラフィックを引き継ぎます。
コールドスタンバイ。アプリケーションはプライマリリージョンで実行されていますが、セカンダリリージョンで起動可能な状態になっています（ただし、実行はされていません）。プライマリリージョンに障害が発生した場合は、セカンダリリージョンでアプリケーションが起動されます。アプリケーションの停止は、アプリケーションが実行可能となり、すべてのアプリケーションサービスをアプリケーションクライアントに提供できるようになるまで続きます。
スタンバイなし。このモデルでは、アプリケーションコードをセカンダリリージョンにデプロイする準備はできていますが、まだデプロイされていません（つまり、デプロイされたリソースも使用していません）。プライマリリージョンでアプリケーションが停止した場合、まず、セカンダリリージョンでアプリケーションのデプロイを行う必要があります。このデプロイでは、アプリケーションはコールドスタンバイと同じ状態になります。つまり、起動する必要があります。このアプローチでは、クラウドリソースの作成を含むアプリケーションのデプロイを最初に行う必要があるため、コールドスタンバイの場合よりもアプリケーションの停止時間が長くなります。

データベースの観点では、上記のリストで説明した即応能力モデルは、次のデータベースに相当します。

トランザクション的に同期されたデータベース。このデータベースは、ホットスタンバイモデルに相当します。プライマリリージョン内のすべてのトランザクションが、同期的な調整でセカンダリリージョンで commit されます。サービスの停止中にセカンダリリージョンがプライマリリージョンになった場合、データベースは整合性が保たれており、すぐに利用可能になります。このモデルでは、目標復旧時点（RPO）と目標復旧時間（RTO）はどちらもゼロです。
非同期で複製されるデータベース。このデータベースも、ホットスタンバイモデルに相当します。プライマリリージョンからセカンダリリージョンへのデータベースレプリケーションは非同期であるため、プライマリリージョンで障害が発生した場合、一部のトランザクションがセカンダリリージョンに複製されない可能性があります。セカンダリリージョンのデータベースは本番環境の負荷に対応する準備は整っていますが、最新のデータを持っていない場合があります。このため、復元不能なトランザクションが失われる可能性があります。このリスクのため、このアプローチでは RTO はゼロですが、RPO は 0 よりも大きくなります。
アイドル状態のデータベース。このデータベースはコールドスタンバイモデルに相当します。このデータベースはデータなしで作成されます。プライマリリージョンで障害が発生した場合、データをアイドル状態のデータベースに読み込む必要があります。そのためには、プライマリリージョンで定期的にバックアップを作成し、セカンダリリージョンに転送する必要があります。バックアップは、データベースエンジンのサポートに応じて、完全バックアップまたは増分バックアップになります。いずれの場合も、データベースは前回のバックアップに戻ります。アプリケーションの観点からは、プライマリリージョンと比較して多くのトランザクションが失われる可能性があります。このアプローチは費用効率が高いかもしれませんが、データベースの状態が最新でないために使用可能な前回のバックアップ以降のすべてのトランザクションが失われるというリスクがあるため、価値が軽減されます。
データベースなし。このモデルは、スタンバイなしの場合と同じです。セカンダリリージョンにはデータベースがインストールされていません。プライマリリージョンに障害が発生した場合は、データベースを作成する必要があります。作成が完了したデータベースは、アイドリングデータベースの場合と同様に、アプリケーションで使用できるようにする前にデータとともに読み込む必要があります。

このドキュメントで説明する障害復旧アプローチは、プライマリリージョンとセカンダリリージョンの代わりに、プライマリクラウドとセカンダリクラウドを使用する場合にも適用されます。主な違いは、クラウド間にさまざまなネットワークが混在することにより、クラウド内のリージョン間のネットワーク区間と比較してクラウド間のレイテンシが増加する可能性があることです。

クラウド全体の障害は、リージョンの障害よりも発生する可能性が低いです。しかし、企業が 2 つのクラウドにアプリケーションをデプロイすることは有用です。このアプローチは、企業を障害から保護するのに役立ち、あるいはビジネスまたは業界の規制を満たすのに役立ちます。

障害復旧のもう 1 つの方法として、プライマリリージョンとセカンダリリージョン、プライマリクラウドとセカンダリクラウドを用意することがあります。このアプローチにより、企業は障害状況に対処するための最適な障害復旧プロセスを選択できます。アプリケーションの実行を可能にするには、停止の重大度に応じてセカンダリリージョンまたはセカンダリクラウドを使用します。

クラウドバースト機能

クラウドバースト機能とは、異なるデプロイロケーション間でアプリケーションクライアントのトラフィックのスケールアップを可能にする構成のことです。容量の需要が増え、スタンバイロケーションから追加の容量が提供されると、アプリケーションはバーストします。プライマリロケーションは通常のトラフィックをサポートしますが、スタンバイロケーションは、プライマリロケーションがサポートできる範囲を超えてアプリケーションクライアントのトラフィックが増加した場合に追加容量を提供できます。プライマリロケーションとスタンバイロケーションはどちらも、アプリケーションサービスインスタンスがデプロイされています。

クラウドバースト機能は、複数のクラウドにまたがって実装されています。ここで、1 つ目のクラウドがプライマリクラウド、2 つ目のクラウドがスタンバイクラウドです。ハイブリッドクラウドのコンテキストで、オンプレミスデータセンターの限られた数のコンピューティングリソースをパブリッククラウドの弾力性のあるクラウドコンピューティングリソースで拡張するのに使用します。

データベースサポートでは、次のオプションが利用できます。

プライマリロケーションへのデプロイ。このデプロイでは、データベースはプライマリロケーションにのみデプロイされ、スタンバイロケーションにはデプロイされません。アプリケーションがバーストすると、スタンバイロケーションのアプリケーションがプライマリロケーションのデータベースにアクセスします。
プライマリロケーションとスタンバイロケーションへのデプロイ。このデプロイは、プライマリロケーションとスタンバイロケーションの両方をサポートしています。データベースインスタンスは両方のロケーションにデプロイされます。バーストした場合、アプリケーションサービスインスタンスは、それぞれのロケーションにデプロイされたデータベースにアクセスします。クラウド内およびクラウド間の障害復旧と同様に、2 つのデータベースをトランザクション的に同期することも、非同期に同期することもできます。非同期の同期では遅延が発生する可能性があります。更新がスタンバイロケーションで行われる場合、これらの更新をプライマリロケーションに伝播する必要があります。両方のロケーションで同時に更新が発生する可能性がある場合は、競合の解決を実装する必要があります。

クラウドバースト機能は、オンプレミスのデータセンターの容量を増やすために、ハイブリッドクラウドでよく使用されます。これは、データを国内に保管する必要がある場合に、パブリッククラウド間で使用できるアプローチでもあります。1 つの国に 1 つのリージョンしかないパブリッククラウドを使用している場合に、同じ国の別のパブリッククラウドのリージョンにバーストできます。このアプローチにより、パブリッククラウドリージョンのリージョン内でリソースの制約に対応しながら、データは確実に国内に保管されます。

クラス最高のクラウドサービスの使用

アプリケーションの中には、単一のクラウドでは利用できない、専用のクラウドのサービスと製品を必要とするものがあります。たとえば、あるクラウドでビジネスデータのビジネスロジック処理を、別のクラウドでビジネスデータの分析を行う場合です。このユースケースでは、アプリケーションのビジネスロジック処理部分と分析部分が異なるクラウドにデプロイされます。

データ管理の観点からは、このユースケースは次のとおりです。

パーティション分割データ。アプリケーションの各部分には独自のデータベース（別々のパーティション）があり、どちらのデータベースも互いに直接接続されていません。データを管理するアプリケーションは、両方のデータベース（パーティション）で使用する必要があるすべてのデータを 2 回書き込みます。
非同期で複製されるデータベース。あるクラウドのデータを他のクラウドで使用する必要がある場合は、非同期のレプリケーション関係が適している可能性があります。たとえば、分析アプリケーションがビジネスアプリケーション用の同じデータセットまたはデータセットのサブセットを必要とする場合は、後者をクラウド間で複製できます。
トランザクション的に同期されたデータベース。このようなデータベースでは、両方のアプリケーションでデータが利用可能になります。それぞれのアプリケーションからの更新はトランザクションとしての一貫性を持ち、両方のデータベース（パーティション）ですぐに使用できます。トランザクション的に同期されたデータベースは、事実上、単一の分散データベースとして機能します。

分散サービス

分散サービスは、複数のデプロイ先ロケーションにデプロイされて実行されます。すべてのサービスインスタンスをすべてのデプロイ先ロケーションにデプロイできます。また、ハードウェアの可用性や予想される負荷の上限などの要因に基づいて、一部のサービスをすべてのロケーションにデプロイし、一部のサービスをいずれかのロケーションにのみデプロイすることもできます。

トランザクション的に同期されたデータベースのデータは、すべてのロケーションで整合しています。このため、すべてのデータベースロケーションにサービスインスタンスをデプロイするには、このようなデータベースが最適なオプションです。

非同期でレプリケートされたデータベースを使用すると、同じデータ項目が 2 つのデプロイロケーションで同時に変更されるリスクがあります。2 つの競合する変更のうちどちらが最終的な整合状態なのかを判断するには、競合解決戦略を実装する必要があります。競合解決を実装することは可能ですが、それは常に簡単なわけではなく、整合状態にデータを戻すために手動による介在がときどき必要になります。

分散型サービスの移動とフェイルオーバー

クラウドリージョン全体で障害が発生した場合は、障害復旧を開始します。ステートフルデータベースアプリケーション内の単一のサービス（リージョンまたはアプリケーション全体ではない）に障害が発生した場合は、サービスを復元して再起動する必要があります。

障害復旧の最初のアプローチは、障害が発生したサービスを元のデプロイロケーションで再起動することです（原位置再起動アプローチ）。Kubernetes などのテクノロジーでは、構成に基づいてサービスが自動的に再起動します。

しかし、この原位置再起動アプローチが成功しない場合は、代わりにセカンダリロケーションでサービスを再起動します。サービスは、プライマリロケーションからセカンダリロケーションにフェイルオーバーします。アプリケーションが一連の分散サービスとしてデプロイされている場合は、単一のサービスのフェイルオーバーは動的に行うことができます。

データベースの観点からは、元のデプロイロケーションでのサービスの再起動には、特定のデータベースのデプロイは必要ありません。サービスが代わりのデプロイロケーションに移動し、データベースにアクセスすると、この文書で前に分散サービスで説明したものと同じ即応能力モデルが適用されます。

サービスの移動が一時的なもので、移動中に長いレイテンシを許容できる場合、サービスはデプロイロケーションを超えてデータベースにアクセスできます。サービスは移動しますが、元のデプロイロケーションからアクセスするのと同じ方法でデータベースにアクセスします。

コンテキスト依存のデプロイ

通常、すべてのアプリケーションクライアントに対応する単一のアプリケーションデプロイには、そのアプリケーションサービスとデータベースがすべて含まれています。ただし、例外のユースケースもあります。1 つのアプリケーションデプロイが、特定の基準に基づいて、クライアントのサブセットのみにサービスを提供することもあります。つまり、複数のアプリケーションデプロイが必要になります。各デプロイはクライアントのそれぞれのサブセットにサービスを提供し、そうしたデプロイ全体ですべてのクライアントにサービスを提供します。

コンテキスト依存のデプロイのユースケースの例は次のとおりです。

マルチテナントアプリケーションをデプロイするとき、あるアプリケーションをすべての小規模テナントにデプロイし、別のアプリケーションを 10 個の中規模テナントごとにデプロイし、もう 1 つのアプリケーションをプレミアムテナントごとにデプロイする場合。
たとえば、企業顧客と政府機関顧客など、顧客を分離する必要がある場合。
開発環境、ステージング環境、本番環境を分離する必要がある場合。

データベースの観点からは、アプリケーションのデプロイごとに 1 対 1 のデプロイ戦略で 1 つのデータベースをデプロイできます。次の図に示すように、この戦略は単純なデプロイ方法です。各デプロイには独自のデータセットが存在するため、パーティション分割されたデータが作成されます。

各アプリケーションのデプロイには個別のデータベースが含まれています。

上の図は、次のことを示しています。

この環境には、アプリケーションの 3 つのデプロイがあります。
各データセットにはそれぞれ独自のデータベースがあります。
データがデプロイ間で共有されることはありません。

多くの場合は 1 対 1 のデプロイが最適な戦略ですが、代替手段もあります。

マルチテナントの場合、テナントを移動することがあります。小規模のテナントが中規模のテナントになり、別のアプリケーションに移動する必要が生じる場合があります。この場合、個々のデータベースデプロイでデータベースの移行が必要になります。分散データベースがデプロイされ、すべてのデプロイで同時に使用されている場合、すべてのテナントデータは単一のデータベースシステムに格納されています。このため、データベース間でテナントを移動する際に、データベースを移行する必要はありません。次の図は、このようなデータベースの例を示しています。

すべてのアプリケーションのデプロイで、分散データベースが共有されています。

上の図は、次のことを示しています。

アプリケーションの 3 つのデプロイがあります。
デプロイはすべて、単一の分散データベースを共有します。
アプリケーションは各デプロイのすべてのデータにアクセスできます。
データパーティショニングは実装されていません。

ライフサイクルオペレーションの一環としてテナントを頻繁に移動する場合は、データベースのレプリケーションが有効な代替手段になることがあります。このアプローチでは、テナント移行前に、テナントデータがデータベース間で複製されます。この場合、アプリケーションのデプロイごとに独立したデータベースが使用され、テナント移行の直前と移行中にのみレプリケーションが行われます。次の図は、テナント移行中の 2 つのアプリケーションデプロイ間での一時的なレプリケーションを示しています。

2 つのアプリケーションデプロイ間での一時的なデータベースレプリケーション。

上の図は、それぞれのデプロイに関連付けられたデータを保持する 3 つの別々のデータベースを持つアプリケーションの 3 つのデプロイを示しています。1 つのデータベースから別のデータベースにデータを移行するために、一時的なデータベース移行を設定できます。

アプリケーションのポータビリティ

アプリケーションのポータビリティにより、アプリケーションを異なるデプロイロケーションに、特に異なるクラウドにデプロイできることを保証します。このポータビリティにより、移行専用の再設計や、アプリケーション移行の準備のための追加のアプリケーション開発を必要とせずに、いつでもアプリケーションを移行できることを保証します。

アプリケーションのポータビリティを保証するために、次のいずれかの方法を使用できます。これについては、このセクションで後述します。

システムベースのポータビリティ
API の互換性
機能ベースのポータビリティ

システムベースのポータビリティでは、すべての可能性のあるデプロイで使用されるものと同じテクノロジーコンポーネントが使用されます。システムベースのポータビリティを保証するには、それぞれのテクノロジーがすべての可能性のあるデプロイロケーションで利用可能である必要があります。たとえば、PostgreSQL のようなデータベースが候補である場合は、すべての可能性のあるデプロイロケーションにおけるその可用性を、想定する時間枠で確認する必要があります。たとえば、プログラミング言語やインフラストラクチャテクノロジーなど、他のすべてのテクノロジーについても同様です。次の図に示すように、このアプローチではテクノロジーに基づいて、すべてのデプロイロケーション間に共通する一連の機能が確立されます。

同じテクノロジーのデプロイによるポータビリティ。

上の図は、ポータブルアプリケーションのデプロイを示しています。アプリケーションは、デプロイされるすべてのロケーションに、まったく同じデータベースシステムがあると想定しています。各ロケーションで同じデータベースシステムが使用されているため、アプリを移植できます。アプリケーションは、デプロイ全体でまったく同じデータベースシステムが使用されていると想定できます。したがって、まったく同じデータベースシステムインターフェースと動作を使用できると想定できます。

データベースのコンテキストで、API 互換性システムでは、クライアントは特定のデータベースアクセスライブラリ（たとえば、MySQL クライアントライブラリ）を使用して、クラウド環境でのアプリ開発で利用可能な遵守した実装に接続できるようにします。次の図は、API の互換性を示しています。

同じ API をサポートする別のテクノロジーをデプロイすることで、ポータビリティを実現。

上の図は、データベースシステムではなくデータベースシステムの API に基づくアプリケーションのポータビリティを示しています。データベースシステムはロケーションごとに異なっていても API は同じで、公開する機能も同じです。基盤となるデータベースシステムが別のデータベーステクノロジーであっても、各ロケーションで同じ API を使用できるため、アプリケーションは移植可能です。

機能ベースのポータビリティでは、同じ機能を提供するさまざまなテクノロジーをさまざまなクラウドで使用できます。たとえば、データベースの使用をリレーショナルモデルに制限できる場合があります。どのリレーショナルデータベースシステムでもアプリケーションをサポートできるため、アプリケーションのポータビリティに影響を与えることなく、さまざまなバージョンのさまざまなデータベースシステムをさまざまなクラウドで使用できます。機能ベースのポータビリティの欠点は、データベースモデルで、すべてのリレーショナルデータベースシステムがサポートする部分のみを使用できることです。すべてのクラウドと互換性のあるデータベースシステムではなく、データベースモデルを使用する必要があります。次の図は、機能ベースのポータビリティのアーキテクチャの例を示しています。

異なるテクノロジー、異なる API をデプロイする一方で、同じデータベースモデルをデプロイすることでポータビリティを実現。

上の図に示すように、データベースシステムの API とデータベースシステムは各ロケーションで異なる場合があります。ポータビリティを保証するため、各ロケーションで使用可能な、各データベースシステムと各 API の一部のみを使用する必要があります。各ロケーションでは各データベースシステムのサブセットのみが一般に使用可能なため、アプリケーションは使用をそのサブセットに制限する必要があります。

このセクションのすべてのオプションに対してポータビリティを保証するには、すべてのターゲットロケーションに完全なアーキテクチャを継続的にデプロイする必要があります。すべての単体テストケースとシステムテストケースを、これらのデプロイに対して実行する必要があります。これらは、インフラストラクチャとテクノロジーにおける変化を早期に検出して対処するための不可欠な要件です。

ベンダーへの依存の防止

ベンダーへの依存（ロックイン）の防止は、特定のテクノロジーやベンダーへの依存のリスクを軽減するのに役立ちます。これは一見、アプリケーションのポータビリティに似ています。ベンダーへの依存の防止は、クラウドサービスだけでなく、使用するすべてのテクノロジーに適用されます。たとえば、MySQL がデータベースシステムとして使用され、クラウド内の仮想マシンにインストールされる場合、クラウドの観点では依存関係はありませんが、MySQL には依存関係があります。クラウド間でポータブルなアプリケーションが、そのクラウドとは異なるベンダーから提供されるテクノロジーに依存する場合があります。

ベンダーへの依存を防止するために、すべてのテクノロジーを置き換え可能にする必要があります。このため、アプリケーションの実装方法に影響を与えることなく、各アプリケーションサービスを異なるテクノロジー基盤に再実装できるように、すべてのアプリケーション機能を体系的かつ完全に抽象化する必要があります。データベースの観点では、こうした抽象化は、データベースモデルの使用と特定のデータベース管理システムを分離することで実現できます。

既存の本番環境データベース管理システム

多くのマルチクラウドアプリケーションはデータベースシステムを設計の一部として開発されますが、多くの企業ではアプリケーションモダナイゼーションの一環としてマルチクラウドアプリケーションを開発しています。これらのアプリケーションは、新しく設計、実装されるアプリケーションが既存のデータベースにアクセスすることを前提として開発されます。

既存のデータベースをモダナイゼーションに組み込まない理由はさまざまです。他のデータベースシステムからは使用できない特定の機能が使用されている場合があります。企業に複雑で適切に確立された管理プロセスを備えたデータベースがあり、別のシステムへの移行が非現実的または非経済的になっている場合があります。また、最初のフェーズでアプリケーションをモダナイズし、2 番目のフェーズでデータベースをモダナイズすることもあります。

企業が既存のデータベースシステムを使用する場合、マルチクラウドアプリケーションの設計者は、これが唯一のデータベースとして使用されるか、または異なるデータベースシステムをさまざまなデプロイロケーションに追加する必要があるかを決定する必要があります。たとえば、データベースがオンプレミスで使用され、アプリケーションを Google Cloud でも実行する必要がある場合は、Google Cloud にデプロイされたアプリケーションサービスがオンプレミスのデータベースにアクセスするかどうかを検討する必要があります。または、2 つ目のデータベースを Google Cloud とローカルで実行されているアプリケーションサービスの両方にデプロイする必要があるかどうかを検討します。

2 つ目のデータベースを Google Cloud にデプロイする場合、このユースケースはクラウドバーストまたは分散サービスで説明したユースケースと同じものである可能性があります。いずれの場合でも、これらのセクションと同じデータベースの説明が適用されます。ただし、既存のオンプレミスのデータベースでサポートできるクロスロケーション機能（同期やレプリケーションなど）に限定されます。

デプロイパターン

このドキュメントで説明するユースケースでは、データベースの観点からデータベースが複数のデプロイロケーションにある場合、データベース同士の関係はどうなっているかというよくある疑問が発生します。

次のセクションで説明する主な種類の関係（デプロイパターン）は次のとおりです。

クロスデータベースの依存関係が存在しない状態でのパーティション分割
非同期の一方向レプリケーション
競合解決による双方向レプリケーション
完全にアクティブ / アクティブな同期分散システム

このドキュメントの各ユースケースは 4 つのデプロイパターンの 1 つ以上にマッピングできます。

次の説明では、クライアントがアプリケーションサービスに直接アクセスしていることを前提としています。ユースケースに応じて、次の図に示すように、クライアントをアプリケーションに動的にアクセスするように導くために、ロードバランサが必要になる場合があります。

ロードバランサを介したクライアントアクセス。

前の図では、クラウドロードバランサが、クライアントの呼び出しを利用可能なロケーションの 1 つに導きます。ロードバランサにより、ロードバランシングポリシーが適用され、クライアントがアプリケーションとそのデータベースの正しいロケーションに導かれることを保証します。

クロスデータベースの依存関係が存在しない状態でのパーティション分割

このデプロイパターンは、このドキュメントで説明するすべてのパターンの中で最も簡単です。各ロケーションまたは各クラウドにデータベースがあり、データベースには相互に依存しないパーティションデータセットが含まれています。データ項目は 1 つのデータベースにのみ保存されます。各データパーティションはそれぞれ固有のデータベースに配置されます。このパターンの例は、データセットがどちらか一方のデータベースにあるマルチテナントアプリケーションです。次の図は、2 つの完全にパーティション分割されたアプリケーションを示しています。

完全にパーティション分割されたデータベースのデプロイ。

前の図に示すように、アプリケーションは 2 つのロケーションにデプロイされ、それぞれがデータセット全体のパーティションを担当します。各データ項目はロケーションの 1 つにのみ存在し、パーティション分割されたデータセットは 2 つの間でレプリケーションされないことを保証します。

パーティション分割データベースのもう 1 つのデプロイパターンとして、データセットを完全にパーティション分割しつつ、同じデータベース内に格納する方法があります。すべてのデータセットを含むデータベースが 1 つだけ存在します。データセットは同じデータベース内に保存されますが、完全に分割（パーティション分割）されており、1 つのデータセットを変更してももう 1 つのデータセットは変更されません。次の図は、1 つのデータベースを共有する 2 つのアプリケーションを示しています。

複数のロケーションをサポートする単一のデータベースインスタンス。

上の図は、次のことを示しています。

最初のロケーションにあるデータベースが 2 つのアプリケーションデプロイによって共有されている。
データセットはパーティション分割されていないため、各アプリケーションはデプロイの全データにアクセスできる。

非同期の一方向レプリケーション

このデプロイパターンには、1 つ以上のセカンダリデータベースに複製されるプライマリデータベースがあります。セカンダリデータベースは読み取りアクセスに使用できます。このパターンの例は、特定のユースケースに最適なデータベースをプライマリデータベースとして使用し、セカンダリデータベースを分析に使用する場合です。次の図は、一方向にレプリケートされるデータベースにアクセスする 2 つのアプリケーションを示しています。

非同期の一方向レプリケーション

前の図に示すように、2 つのデータベースの一方はもう一方のレプリカです。図の矢印は、レプリケーションの方向を示します。ロケーション 1 のデータベースシステムからのデータは、ロケーション 2 のデータベースシステムにレプリケーションされます。

競合解決による双方向レプリケーション

このデプロイパターンには、相互に非同期でレプリケーションされる 2 つのプライマリデータベースがあります。同じデータが各データベースに同時に書き込まれた場合（たとえば、同じ主キー）、書き込み / 書き込みの競合を引き起こす可能性があります。このリスクのため、レプリケーション中にどの状態が最後の状態かを判断するために、競合解決を設ける必要があります。このパターンは、書き込み / 書き込みの競合が発生する機会が稀な状況で使用できます。次の図は、双方向レプリケーションデータベースにアクセスすーションを示しています。

競合解決による双方向レプリケーション

上の図に示すように、各データベースはもう一方のデータベースにレプリケーションされます。図に 2 つの別々の青い矢印で示されているように、2 つのレプリケーションは互いに独立しています。2 つのレプリケーションは独立しているため、偶然、同じデータ項目がそれぞれのアプリケーションによって変更され、同時にレプリケーションされた場合、競合が発生する可能性があります。この場合、競合解決が必要になります。

完全にアクティブ / アクティブな同期分散システム

このデプロイパターンには、アクティブ / アクティブ（プライマリ / プライマリまたはマスター / マスター）の設定を持つ単一のデータベースがあります。アクティブ / アクティブの設定では、プライマリデータベースのデータの更新がトランザクションとしての一貫性を持ち、同期的にレプリケートされます。このパターンのユースケースの一例として、分散コンピューティングがあります。次の図は、完全に同期されたプライマリ / プライマリデータベースにアクセスする 2 つのアプリケーションを示しています。

完全なプライマリ / プライマリの同期が行われる分散データベース。

上の図が示すように、この配置により、各アプリケーションは、遅延や競合のリスクを生じることなく、最後に整合性が取れていた状態に常にアクセスできます。一方のデータベースでの変更は、直ちにもう一方のデータベースで有効になります。トランザクションの変更が commit されると、変更が両方のデータベースに反映されます。

データベースシステムの分類

このドキュメントで説明するデプロイパターンで、すべてのデータベース管理システムを同じように良好な状態で使用できるわけではありません。ユースケースによっては、1 つデプロイパターンを実装することのみが可能です。または、データベースシステムのサブセットをデプロイパターンの組み合わせで実装できる場合もあります。

次のセクションでは、さまざまなデータベースシステムを分類して、4 つのデプロイパターンにマッピングします。

データモデル、内部アーキテクチャ、デプロイモデル、トランザクションタイプなど、さまざまな分割項目でデータベースを分類できます。次のセクションでは、マルチクラウドデータベース管理を目的として 2 つの次元を使用します。

デプロイアーキテクチャ。データベース管理システムがクラウドのリソース（例: コンピューティングエンジン、クラウドマネージドサービス）にデプロイされる方法についてのアーキテクチャ。
分散モデル。データベースシステムがサポートする分散モデル（単一インスタンス、完全分散など）。

これら 2 つの次元は、マルチクラウドのユースケースに最も関連性が高く、マルチクラウドデータベースのユースケースから導き出された 4 つのデプロイパターンをサポートできます。一般的な分類は、データベース管理システムでサポートされているデータモデルに基づいています。一部のシステムでは、1 つのモデルのみがサポートされます（グラフモデルなど）。他のシステムでは、複数のデータモデル（リレーショナルモデルやドキュメントモデルなど）が同時にサポートされます。ただし、マルチクラウドデータベース管理のコンテキストでは、マルチクラウドアプリケーションはマルチクラウドデプロイに任意のデータモデルを使用できるため、この分類は関係ありません。

デプロイアーキテクチャ別のデータベースシステム

マルチクラウドデータベース管理には、データベース管理システム用の次の 4 つの主要なデプロイアーキテクチャが存在します。

組み込みのクラウドデータベース。組み込みのクラウドデータベースは、クラウドテクノロジーと連携するように設計、構築、最適化されています。たとえば、一部のデータベースシステムでは、実装プラットフォームとして Kubernetes を使用し、Kubernetes 機能を使用しています。CockroachDB と YugaByte は、この種のデータベースの例です。これらは Kubernetes をサポートする任意のクラウドにデプロイできます。
クラウドプロバイダが管理するデータベース。クラウドプロバイダが管理するデータベースは、クラウドプロバイダ独自の技術に基づいて構築され、特定のクラウドプロバイダが管理するデータベースサービスです。Spanner や Bigtable は、この種類のデータベースの例です。クラウドプロバイダが管理するデータベースは、そのクラウドプロバイダのクラウドでのみ使用でき、他の場所でインストールして実行することはできません。
クラウド以前のデータベース。クラウド前データベースは、クラウドテクノロジーが開発される前から存在しており（長期間にわたる場合もあります）、通常はベアメタルハードウェアおよび仮想マシン（VM）で実行されます。この種のデータベースの例としては、PostgreSQL と MySQL があります。これらのシステムは、必要な仮想マシンやベアメタルハードウェアをサポートする任意のクラウドで実行できます。
クラウドパートナーが管理するデータベース。一部のパブリッククラウドには、そのパブリッククラウドのユーザーのデータベースをインストールして管理するデータベースパートナーがあります。このため、ユーザーがこれらのデータベースを自分で管理する必要はありません。この種のデータベースの例としては、MongoDB Atlas や MariaDB があります。

これらのメインカテゴリにはいくつかのバリエーションがあります。たとえば、クラウド用に構築されたデータベースを実装するデータベースベンダーが、ベンダー提供のクラウドで、クラウド用に構築されたテクノロジーへのインストールとマネージドサービスを顧客に提供することもあります。このアプローチは、ベンダーが自社のデータベースのみを単一のサービスとしてサポートするパブリッククラウドを提供する場合と同等です。

クラウド以前のデータベースはコンテナにも存在し、Kubernetes クラスタにデプロイできる可能性があります。ただし、これらのデータベースではスケーリング、マルチサービス、マルチ Pod デプロイなどの Kubernetes 固有の機能は使用されません。

データベースベンダーは、同時に複数のパブリッククラウドプロバイダと提携し、複数のパブリッククラウドでクラウドパートナーが管理するデータベースとしてデータベースを提供することがあります。

分散モデル別のデータベースシステム

データベースのアーキテクチャの分散モデルに応じて、さまざまなデータベース管理システムが実装されます。データベースのモデルには、次のようなものがあります。

単一インスタンス。単一のデータベースインスタンスは、1 つの VM または 1 つのコンテナで実行され、一元化されたシステムとして機能します。このシステムがすべてのデータベースアクセスを管理します。1 つのインスタンスは他のどのインスタンスにも接続できないため、このデータベースシステムはレプリケーションをサポートしていません。
複数インスタンスのアクティブ / パッシブ。この共通アーキテクチャでは、複数のデータベースインスタンスが一緒にリンクされています。最も一般的なリンクはアクティブ / パッシブ関係で、1 つのインスタンスがアクティブなデータベースインスタンスとなって両方のインスタンスをサポートし、書き込みと読み取りを行います。1 つ以上のパッシブシステムは読み取り専用で、プライマリから同期または非同期のいずれかでデータベースのすべての変更を受け取ります。パッシブシステムは読み取りアクセス権を提供できます。アクティブ / パッシブは、プライマリ / セカンダリまたはマスター / スレーブとも呼ばれます。
複数インスタンスがアクティブ / アクティブ。この比較的まれなアーキテクチャでは、各インスタンスがアクティブインスタンスになります。この場合、各インスタンスが読み取りおよび書き込みトランザクションを実行し、データの整合性を提供できます。このような理由から、データの不整合を防ぐために、すべてのインスタンスが常に同期されます。
競合解決による複数インスタンスのアクティブ / アクティブ。このシステムも比較的まれです。各インスタンスは書き込みアクセスと読み取りアクセスが可能ですが、データベースは非同期モードで同期されます。同じデータ項目の同時更新が許可されるため、状態は不整合になります。競合解決ポリシーで、どの状態が最後に整合性のある状態かを判断する必要があります。
マルチインスタンスシャーディング。シャーディングは、（分離された）データパーティションの管理に基づきます。各パーティションは、それぞれ別のデータベースインスタンスによって管理されます。時間の経過とともにより多くのシャードを動的に追加できるため、この分散はスケーラブルです。ただし、この機能は一部のシステムでサポートされていないため、シャード間のクエリを使用できない場合があります。

このセクションで説明する分散モデルはすべてシャーディングに対応しており、シャーディングされたシステムにできます。ただし、すべてのシステムがシャーディングオプションを提供するように設計されているわけではありません。シャーディングはスケーラビリティに関係する概念であり、一般的にマルチクラウド環境におけるアーキテクチャに関するデータベースの選択には関係ありません。

分散モデルは、クラウドデータベースとパートナー管理のデータベースでは異なります。これらのデータベースはクラウドプロバイダのアーキテクチャに関連付けられており、これらのシステムでは、次のデプロイロケーションに基づいてアーキテクチャを実装しています。

ゾーンシステム。ゾーン管理データベースシステムはゾーンに関連付けられています。ゾーンが使用可能な場合は、データベースシステムも使用可能になります。ただし、ゾーンが使用できなくなると、データベースにアクセスできなくなります。
リージョンシステム。リージョン管理データベースはリージョンに関連付けられており、少なくとも 1 つのゾーンにアクセスできれば、データベースにアクセスできます。リージョン内のゾーンがアクセスできなくなる場合があります。
クロスリージョンシステム。クロスリージョンシステムは 2 つ以上のリージョンに関連付けられており、少なくとも 1 つのリージョンが利用可能であれば正しく機能します。

企業が使用する予定のすべてのクラウドにデータベースをインストールできる場合は、クロスリージョンシステムはクロスクラウドシステムもサポートできます。

このセクションで説明するマネージドデータベースアーキテクチャの代わりに、他の方法を使用できます。リージョンシステムは、2 つのゾーン間でディスクを共有している場合があります。2 つのゾーンのいずれかにアクセスできなくなった場合、データベースシステムはもう一方のゾーンで処理を続行できます。ただし、停止が両方のゾーンに影響する場合、他のゾーンが完全にオンラインであっても、データベースシステムは使用できなくなります。

データベースシステムとデプロイパターンのマッピング

次の表に、このドキュメントで説明するデプロイパターンとデプロイアーキテクチャの関係を示します。これらのフィールドには、デプロイパターンとデプロイアーキテクチャの組み合わせが可能になるために必要な条件が記載されています。

デプロイアーキテクチャ	デプロイパターン
デプロイアーキテクチャ	クロスデータベースの依存関係が存在しない状態でのパーティション分割	非同期の一方向レプリケーション	競合解決による双方向レプリケーション	完全にアクティブ / アクティブな同期分散システム
組み込みのクラウドデータベース	データベースシステムで使用されるクラウドテクノロジーが組み込まれているすべてのクラウドで可能です。同じデータベースが使用できない場合は、異なるデータベースシステムを使用できます。	レプリケーションを実施するクラウドデータベース。	双方向レプリケーションを実施するクラウドデータベース。	プライマリ / プライマリの同期を実施するクラウドデータベース。
クラウドプロバイダが管理するデータベース	データベースシステムが異なるクラウドシステムに配置されている場合があります。	レプリカは、クラウドプロバイダが管理するデータベースである必要はありません（デプロイパターンにおけるデータベース移行テクノロジーのロールを参照）。	データベースが双方向レプリケーションを実施する場合、クラウド間ではなくクラウド内のみ。	データベースがプライマリ / プライマリの同期を実施する場合は、クラウド間ではなくクラウド内のみ。
クラウド以前のデータベース	データベースシステムは、クラウドごとに同じ場合と異なる場合があります。	複数のクラウドにわたるレプリケーションが可能です。	データベースシステムは、双方向レプリケーションと競合解決を実施します。	データベースシステムは、プライマリ / プライマリの同期を実施します。
クラウドパートナーが管理するデータベース	データベースシステムが異なるクラウドシステムに配置されている場合があります。パートナーが、必要なすべてのクラウドでマネージドデータベースシステムを提供している場合は、同じデータベースを使用できます。	レプリカは、クラウドプロバイダが管理するデータベースである必要はありません。パートナーが、必要なすべてのクラウドでマネージドデータベースシステムを提供している場合は、同じデータベースを使用できます。	データベースシステムは、双方向レプリケーションと競合解決を実施します。	データベースシステムは、プライマリ / プライマリの同期を実施します。

データベースシステムが組み込みのレプリケーションを提供していない場合は、代わりにデータベースレプリケーションテクノロジーを使用できる場合があります。詳細については、デプロイパターンにおけるデータベース移行テクノロジーのロールをご覧ください。

次の表に、デプロイパターンと分散モデルの関係を示します。フィールドには、組み合わせ可能な特定のデプロイパターンと分散モデルについての条件を規定します。

分散モデル	デプロイパターン
分散モデル	クロスデータベースの依存関係が存在しない状態でのパーティション分割	非同期の一方向レプリケーション	競合解決による双方向レプリケーション	完全にアクティブ / アクティブな同期分散システム
単一インスタンス	関連するクラウドの同じまたは異なるデータベースシステムで可能です。	該当なし	該当なし	該当なし
複数インスタンスのアクティブ / パッシブ	関連するクラウドの同じまたは異なるデータベースシステムで可能です。	複数のクラウド間でレプリケーションが可能です。	複数のクラウド間でレプリケーションが可能です。	該当なし
複数インスタンスがアクティブ / アクティブ	関連するクラウドの同じまたは異なるデータベースシステムで可能です。	該当なし	該当なし	クラウド間で同期が可能です。
競合解決による複数インスタンスのアクティブ / アクティブ	関連するクラウドの同じまたは異なるデータベースシステムで可能です。	該当なし	該当なし	クラウド間で双方向レプリケーションが可能な場合に該当します。

基盤となるデータベーステクノロジーに基づいて抽象化を追加する分散モデルの実装には、Postgres-BDR アクティブ / アクティブシステムのように、分散モデルが組み込まれたものは含まれていません。このようなシステムは、前の表にそれぞれのカテゴリで記載されています。マルチクラウドの観点では、分散モデルの実装方法は無関係です。

データベースの移行とレプリケーション

ユースケースによっては、企業はデータベースをあるデプロイロケーションから別のところに移行する必要があります。あるいは、ダウンストリーム処理で、データベースのデータを別のロケーションにレプリケーションする必要があります。次のセクションでは、データベースの移行とデータベースのレプリケーションを詳しく説明します。

データベースの移行

データベースの移行は、データベースをあるデプロイロケーションから別のロケーションに移動する場合に使用されます。たとえば、オンプレミスのデータセンターで実行しているデータベースを移行して、クラウドで実行するような場合です。移行が完了したら、オンプレミスデータセンターのデータベースはシャットダウンします。

データベースを移行する主なアプローチは次のとおりです。

リフト＆シフト。VM とデータベースインスタンスを実行しているディスクが、そのまま移行先の環境にコピーされます。コピーされると起動され、移行は完了します。
エクスポートとインポートと、バックアップと復元どちらの方法でも、データベースシステム機能を使用してデータベースを外部化し、移行先で再作成します。通常、エクスポート / インポートは ASCII 形式に基づいていますが、バックアップと復元はバイナリ形式に基づいています。
ダウンタイムなしで移行。このアプローチでは、アプリケーションシステムが移行元システムにアクセスしている間にデータベースが移行されます。初期読み込み後、変更データキャプチャ（CDC）テクノロジーを使用して、移行元から移行先データベースに変更が送信されます。アプリケーションは、移行元データベースシステムで停止してから、移行の完了後に移行先データベースで再起動するまでの間、ダウンタイムが発生します。

データベースの移行は、データベースがあるクラウドから別のクラウドに、またはある種類のデータベースエンジンから別の種類のデータベースエンジンに移行される場合に関連します。

データベースの移行は多面的なプロセスです。詳細については、データベースの移行: コンセプトと原則（パート 1）とデータベースの移行: コンセプトと原則（パート 2）をご覧ください。

組み込みデータベーステクノロジーを使用して、データベースの移行を行うことができます（たとえば、エクスポート / インポート、バックアップ / 復元、組み込みのレプリケーションプロトコル）。移行元システムと移行先システムが異なるデータベースシステムである場合は、移行テクノロジーがデータベース移行に最適なオプションです。Striim と Debezium は両方とも、データベース移行テクノロジーの例です。

データベースレプリケーション

データベースのレプリケーションは、データベース移行に似ています。ただし、データベースのレプリケーション中、すべての変更がレプリケート先のデータベースに送信されるまで、レプリケート元のデータベースシステムはそのまま維持されます。

データベースレプリケーションは、レプリケート元データベースからレプリケート先データベースに変更を送信する継続的なプロセスです。このプロセスが非同期の場合、変更は少し遅れてレプリケート先データベースに到達します。プロセスが同期の場合、レプリケート元システムへの変更は、レプリケート先システムに対して同時に、同じトランザクションに対して行われます。

レプリケート元データベースからレプリケート先データベースにレプリケーションする以外に、レプリケート元データベースからレプリケート先分析システムにデータを複製することが頻繁にあります。

データベース移行と同様に、レプリケーションプロトコルが組み込まれている場合は、組み込みデータベーステクノロジーをデータベースレプリケーションに使用できます。組み込みのレプリケーションプロトコルがない場合は、Striim や Debezium などのレプリケーションテクノロジーを使用できます。

デプロイパターンにおけるデータベース移行テクノロジーのロール

非同期（異種）レプリケーションなど、異なるデータベースシステムがデプロイパターンで使用されている場合に、レプリケーションを可能にする組み込みデータベーステクノロジーは一般には提供されていません。代わりに、データベース移行テクノロジーをデプロイすると、この種のレプリケーションが可能になります。これらの移行システムの一部は、双方向レプリケーションも実装しています。

データベースシステムのデプロイパターンへのマッピングの表 1 または表 2 で「該当なし」とマークされた組み合わせで使用されるデータベースシステムに対してデータベース移行またはレプリケーションテクノロジーを使用できる場合、データベースレプリケーションに使用できる可能性があります。次の図は、移行テクノロジーを使用したデータベースレプリケーションのアプローチを示しています。

データベース移行とレプリケーションテクノロジーを使用したレプリケーション。

上の図では、ロケーション 1 のデータベースがロケーション 2 のデータベースにレプリケートされています。データベースシステムのレプリケーションを直接行う代わりに、移行サーバーをデプロイしてレプリケーションを実装します。このアプローチは、データベースレプリケーション機能が実装に組み込まれておらず、データベースシステムとは別のシステムに依存してレプリケーションを実装する必要がある場合に使用されます。

マルチクラウドデータベースの選択

マルチクラウドデータベースのユースケースをデータベースシステムの分類と組み合わせると、特定のユースケースに最適なデータベースを決定するのに役立ちます。たとえば、アプリケーションのポータビリティでユースケースを実装するには 2 つのオプションがあります。1 つ目のオプションは、同じデータベースエンジンをすべてのクラウドで使用できることを保証することです。このアプローチにより、システムのポータビリティが保証されます。2 つ目のオプションは、同じデータモデルとクエリインターフェースをすべてのクラウドで使用できることを保証することです。データベースシステムは異なる場合がありますが、ポータビリティは機能的なインターフェース上で提供されます。

以降のセクションのディシジョンツリーは、このドキュメントのマルチクラウドデータベースのユースケースに関する意思決定基準を示しています。ディシジョンツリーは、各ユースケースに対して考慮すべき最適なデータベースについての提案事項を示しています。

既存のデータベースシステムに関するベストプラクティス

データベースシステムが本番環境にある場合は、それを保持するか置換するかを決定する必要があります。次の図に、決定プロセスで尋ねる質問を示します。

既存のデータベースシステムのディシジョンツリー。

ディシジョンツリーにおける質問と回答は次のとおりです。

データベースシステムは本番環境に存在しますか？
- データベースシステムが本番環境に存在しない場合は、データベースシステムを選択します（マルチクラウドデータベースの管理に関する決定に移動します）。
- データベースシステムが本番環境に存在する場合は、保持する必要があるかどうかを評価します。
データベースシステムが本番環境に存在する場合は、保持する必要があるかどうかを評価します。
- データベースシステムを保持する必要がある場合は、ディシジョンが行われ、ディシジョンプロセスが完了します。
- データベースシステムを変更する必要がある場合、またはまだ決定が行われている状態の場合は、データベースシステムを選択します（マルチクラウドデータベース管理に関する決定に進みます）。

マルチクラウドデータベースの管理に関する決定事項

次のディシジョンツリーは、マルチロケーションデータベース要件（マルチクラウドデータベースデプロイを含む）を持つユースケース用です。それはデプロイパターンを意思決定基準の基礎として使用します。

マルチクラウドデータベース管理のディシジョンツリー。

ディシジョンツリーにおける質問と回答は次のとおりです。

データは、データベースをまたいだ依存関係が存在しない状態で異なるデータベース間でパーティション分割されていますか？
- 「はい」の場合は、同じまたは異なるデータベースシステムをロケーションごとに選択できます。
- 該当する場合は次の質問に進みます。
非同期の一方向レプリケーションは必要ですか？
- 「はい」の場合は、データベースレプリケーションシステムを使用できるかどうかを評価します。
  - 「はい」の場合は、レプリケーションシステムと互換性のあるデータベースシステムを選択します。
  - 「いいえ」の場合は、アクティブ / パッシブ分散モデルを実装できるデータベースシステムを選択します。
  - 該当する場合は次の質問に進みます。
同期インスタンスを備えるデータベースシステムを選択します。
- 競合の解決は可能ですか？
  - 「はい」の場合は、双方向レプリケーションデータベースシステムまたはアクティブ / アクティブデータベースシステムを選択します。
  - 「いいえ」の場合は、アクティブ / アクティブシステムを選択します。

複数のマルチクラウドユースケースが実装されている場合、企業は、1 つのデータベースシステムを使用してすべてのユースケースをサポートするか、複数のデータベースシステムにするかを決定する必要があります。

企業がすべてのユースケースをサポートするために 1 つのデータベースシステムを使用する場合は、同期機能が最も優れているシステムが最も適した選択です。たとえば、同期インスタンスだけでなく一方向のレプリケーションも必要な場合は、同期インスタンスが最適な選択です。

同期品質の階層（ゼロから最適）は、パーティション分割、単方向レプリケーション、双方向レプリケーション、完全同期レプリケーションです。

デプロイに関するベストプラクティス

このセクションでは、マルチクラウドアプリケーションの移行または開発に使用するデータベースを選択する際のベストプラクティスに重点を置いて説明します。

既存のデータベース管理システム

特定のユースケースで必要とされる場合を除いて、データベースを変更せずに、データベースを保持することをおすすめします。データベース管理システムが確立されていて、開発、運用、メンテナンスのプロセスが実際に稼働している企業の場合は、変更を行わないことをおすすめします。

クラウド内のデータベースシステムを必要としないクラウドバーストユースケースでは、データベースの変更は必要ありません。もう 1 つのユースケースは、同じクラウド内または別のクラウド内の異なるデプロイロケーションへの非同期レプリケーションです。これらのユースケースでは、ベンチマークを実施して、ロケーション間通信と、データベースへのアクセス時にロケーション間通信とレイテンシがアプリケーション要件を満たしていることを確認することがおすすめのアプローチです。

Kubernetes サービスとしてのデータベースシステム

企業が StatefulSets に基づくサービスとして、Kubernetes 内でデータベースシステムを実行することを検討している場合は、次の要因を考慮する必要があります。

データベースにアプリケーションに必要なデータベースモデルが用意されているかどうか。
Kubernetes サービスとしてのデータベースシステムでの運用化の実装方法を決定する非機能的な要因（たとえば、スケーリングの実行方法（スケールアップとスケールダウン）、バックアップと復元の管理方法、モニタリングをシステムによって有効にする方法）。Kubernetes ベースのデータベースシステムの要件を理解しやすくするためには、企業はデータベースでの経験を比較点として使用する必要があります。
高可用性と障害復旧高可用性を実現するには、リージョン内のゾーンで障害が発生しても、システムが稼働し続ける必要があります。データベースは、あるゾーンから別のゾーンにすばやくフェイルオーバーできる必要があります。ベストケースのシナリオでは、データベースの各ゾーンでインスタンスが実行され、そのインスタンスは RTO と RPO をゼロに抑えるために完全に同期されます。
リージョン（またはクラウド）の障害に対処するための障害復旧。理想的なシナリオでは、データベースは RPO と RTO ゼロで 2 番目のリージョンで引き続き稼働します。理想的ではないシナリオでは、セカンダリリージョンのデータベースがプライマリデータベースからすべてのトランザクションを取得できないことがあります。

Kubernetes 内でデータベースを実行する最適な方法を判断するには、特にシステムが Kubernetes 外部の本番環境内のシステムと互換性を持つ必要がある場合に、完全なデータベース評価がおすすめのアプローチです。

Kubernetes に依存しないデータベースシステム

Kubernetes のサービスとして実装されるアプリケーションでも、必ずしもデータベースを Kubernetes で実行させる必要はありません。データベースシステムを Kubernetes の外部で実行させる必要がある理由はさまざまです（確立されたプロセス、企業内のプロダクトに関する知識、利用不可など）。クラウドプロバイダとクラウドパートナー管理データベースはどちらもこのカテゴリに分類されます。

Compute Engine でデータベースを実行することも可能です。データベースシステムを選択する際は、徹底的なデータベース評価を実施して、アプリケーションのすべての要件を満たしていることを確認することがおすすめの方法です。

アプリケーション設計の観点から見ると、接続プーリングは設計上の重要な考慮事項です。データベースにアクセスするアプリケーションサービスが、内部で接続プールを使用する場合があります。接続プールの使用は、効率の向上とレイテンシの短縮に役立ちます。リクエストは起動を必要とせずにプールから行われるため、接続が作成されるのを待つ必要はありません。アプリケーションサービスインスタンスを追加してアプリケーションをスケールアップすると、各インスタンスで接続プールが作成されます。ベストプラクティスに従っている場合、各プールで最小の接続セットが事前に作成されます。アプリケーションのスケーリングのために別のアプリケーションサービスインスタンスを作成するたびに、接続がデータベースに追加されます。設計の観点から、データベースでは無制限の接続をサポートできないため、過負荷を避けるために接続の追加を管理する必要があります。

最適なデータベースシステムとデータベースシステムのポータビリティ

データベースシステムを選択する際、企業は、アプリケーションの要件に対応する最適なデータベースシステムを選択するのが一般的です。マルチクラウド環境では、各クラウドに最適なデータベースを選択し、ユースケースに応じて相互に接続できます。これらのシステムが異なる場合は、一方向か双方向かにかかわらず、レプリケーションにはかなりの労力が必要となります。最適なシステムを使用するメリットが、実装に必要な労力を上回れば、このアプローチが正当化される場合もあります。

ただし、すべての必要なクラウドで利用可能なデータベースシステム向けのアプローチを同時に検討、評価することがおすすめの方法です。このようなデータベースは最適なオプションほど理想的ではありませんが、そのようなシステムの実装、運用、保守ははるかに容易な場合があります。

同時データベースシステム評価では、両方のデータベースシステムの利点と欠点が確認されており、選択のための確固たる基盤となっています。

組み込みデータベースシステムと外部データベースシステムのレプリケーション

すべてのデプロイロケーション（ゾーン、リージョン、クラウド）にデータベースシステムが必要なユースケースの場合には、レプリケーションは重要な機能です。レプリケーションは、非同期、双方向、または完全に同期されたアクティブ / アクティブレプリケーションです。データベースシステムは、これらすべてのレプリケーションの形式をサポートしているわけではありません。

システム実装レプリケーションの一部としてレプリケーションをサポートしていないシステムの場合は、Striim を利用してアーキテクチャを補完できます（データベース移行で説明しています）。

ベストプラクティスは、代わりのデータベース管理システムを評価して、レプリケーションが組み込まれているシステムまたはレプリケーションテクノロジーを必要とするシステムの利点と欠点を判断することです。

3 つ目のテクノロジークラスがこの役割を担うこともあります。このクラスは、既存のデータベースシステムにレプリケーションを提供するアドオンを提供します。その一例が、MariaDB Galera Cluster です。評価プロセスで認められる場合は、これらのシステムを評価することをおすすめします。

次のステップ

ハイブリッドおよびマルチクラウドのパターンとプラクティスについて確認する。
他のクラウドサービスプロバイダを Google Cloud に接続するためのパターンについて確認する。
Google Cloud でのハイブリッドクラウドとマルチクラウドのデプロイのモニタリングとロギングのアーキテクチャについて確認する。
リファレンスアーキテクチャ、図、ベストプラクティスについては、Cloud アーキテクチャセンターをご確認ください。

マルチクラウド データベース管理: アーキテクチャ、ユースケース、ベスト プラクティス

主な用語と定義

用語

ステートフル データベース アプリケーション

データ ストレージ サービスとしてのキューとファイル

ネットワーキング

マルチクラウド データベースのユースケース

アプリケーションの移行

障害復旧

クラウド バースト機能

クラス最高のクラウド サービスの使用

分散サービス

分散型サービスの移動とフェイルオーバー

コンテキスト依存のデプロイ

アプリケーションのポータビリティ

ベンダーへの依存の防止

既存の本番環境データベース管理システム

デプロイ パターン

クロス データベースの依存関係が存在しない状態でのパーティション分割

非同期の一方向レプリケーション

競合解決による双方向レプリケーション

完全にアクティブ / アクティブな同期分散システム

データベース システムの分類

デプロイ アーキテクチャ別のデータベース システム

分散モデル別のデータベース システム

データベース システムとデプロイ パターンのマッピング

データベースの移行とレプリケーション

データベースの移行

データベース レプリケーション

デプロイ パターンにおけるデータベース移行テクノロジーのロール

マルチクラウド データベースの選択

既存のデータベース システムに関するベスト プラクティス

マルチクラウド データベースの管理に関する決定事項

デプロイに関するベスト プラクティス

既存のデータベース管理システム

Kubernetes サービスとしてのデータベース システム

Kubernetes に依存しないデータベース システム

最適なデータベース システムとデータベース システムのポータビリティ

組み込みデータベース システムと外部データベース システムのレプリケーション

次のステップ

マルチクラウドデータベース管理: アーキテクチャ、ユースケース、ベストプラクティス

ステートフルデータベースアプリケーション

データストレージサービスとしてのキューとファイル

マルチクラウドデータベースのユースケース

クラウドバースト機能

クラス最高のクラウドサービスの使用

デプロイパターン

クロスデータベースの依存関係が存在しない状態でのパーティション分割

データベースシステムの分類

デプロイアーキテクチャ別のデータベースシステム

分散モデル別のデータベースシステム

データベースシステムとデプロイパターンのマッピング

データベースレプリケーション

デプロイパターンにおけるデータベース移行テクノロジーのロール

マルチクラウドデータベースの選択

既存のデータベースシステムに関するベストプラクティス

マルチクラウドデータベースの管理に関する決定事項

デプロイに関するベストプラクティス

Kubernetes サービスとしてのデータベースシステム

Kubernetes に依存しないデータベースシステム

最適なデータベースシステムとデータベースシステムのポータビリティ

組み込みデータベースシステムと外部データベースシステムのレプリケーション