NETWORK ENGINEER BLOG

Tips and Reviews for Engineers

vSphere 5.0 の HA 機構について

vSphere 5.0 の HA 機構の特徴は、以下のとおりです。

  • vSphere 4.1 で必須だった vCenter 及び、クラスタに参加する ESXi ホストで名前解決が必須ではなくなりました。これに伴い、クラスタを構成するために必要だった、DNS サーバーの構築及び、hosts の設定は不要になりました。

  • vSphere 4.1 では、HA の Agent に Legato Systems 社の AAM を使用していましたが、FDM(Fault Domain Manage)に変更されました。

  • vSphere 4.1(AAM) では、クラスタに参加するホスト間で、最大 5台の Primary と、複数の Secondary でクラスタが構成されますが、vSphere 5.0(FDM)では、1台の Master と複数の Slave で構成されます。この実装の変更により、AAM では、5台全ての Primary がダウンすると HA が機能しないという問題が解消されています。

  • vSphere 5.0 では、クラスタ内の Master を GUI で確認できるようになりました。

f:id:FriendsNow:20140607113329p:plain
f:id:FriendsNow:20140607113336p:plain

  • vCenter 5.0 と vSphere 5.0 で構成されたクラスタに、vShpere 4.1 のホストを参加させると、4.1 のホストに FDM の agent がインストールされ、5.0 と 4.1 間で、正常にクラスタを動作させる事が可能です。

  • 各ホストで、FDM エージェントが起動すると、クラスタホストはフォルトドメインに参加していると見なされます。フォルトドメインは Master により管理され、vCenter と vpxa を経由せず直接情報交換を行います。

  • 管理トラフィックを有効としている VMkernel ポートで、ハートビート を受信しなくなった場合、デフォルト G/W へ Ping を実行し、接続性を確認します。この際、G/W へ接続性がなかった場合のふるまい(デフォルト)が 4.1 では、"shutdown" でしたが、5.1 では "Poweon" へ変更しています。

  • 4.1 では、あるホストが、特定のホストから ハートビート を受信しなくなった場合(かつ、自身は G/W への接続性がある場合)、ダウンしたと判断したホストがマウントする仮想ディスクを、引き継ごうとします。当該特定ホストで障害が発生している場合は、引き継ぎ、仮想マシンを救済(HA)しますが、管理ネットワークのみの障害であった場合、仮想ディスクはロックされているので、引き継ぐ事はできません。スプリットブレインを防止するために、これで良いのですが、「ネットワークの故障なのに引き継ごうとする」行為は、わずかですが、無駄な動作でした。

  • 5.0 では、 データストアに接続する vmkernel ポートにハートビートを送信し、ディスクの状態を確認する" データストアハートビート"という機能が実装されました。仮想ディスクをロックしているホストは、定期的に VMFS の Meta 情報にタイムスタンプを書き込み、ロックしていないホストは、その情報を確認します。情報が更新されない場合は、ロックしているホストで障害が発生したと見なし、仮想ディスクを引き継ぐ動作に入ります。