[pgpool-general-jp: 1220] Re: watchdogのtrusted_serverの動きについて

Yugo Nagata nagata @ sraoss.co.jp
2013年 11月 6日 (水) 19:53:22 JST


長田です。

返信が遅くなり申し訳ありません。

On Thu, 31 Oct 2013 19:01:25 +0900
Takanori Urata <takanori.urata @ thot.co.jp> wrote:

> to:pgpool-general-jp メーリングリスト 御中
> 
> pgpool-II 3.3.1のwatchdogを下記のように設定しています。
> 
> [pgpool.confの抜粋]
> use_watchdog = on
> trusted_servers = 'WS01'  <= (DB01 / DB02共同じ)
> 
> wd_hostname = 'DB01'
> wd_lifecheck_method = 'heartbeat'
> heartbeat_destination0 = 'DB02'
> 
> other_pgpool_hostname0 = 'DB02'
> 
> この時、WS01とシャットダウンするとpcp_watchdog_infoコマンドのステータスが”4”になります。
> 
> しかし、WS01を再起動してもpgpool-IIの状態は変化しません。
> 
> 死活監視はheartbeatでDB01-DB02間でも行われているのではないでしょうか?
> なぜ、WS01がシャットダウンした段階で、pgpool-IIのステータスが"4(ダウン)"になってしまうのでしょうか?

上位サーバ(trusted_servers に指定したサーバをそう呼んでいます)への接続
が失敗した場合、上位サーバに障害が発生した可能性も考えられるのですが、
これは回線障害や pgpool-II サーバの障害と切り分けられないため、現状の
実装では pgpool-II 自体がダウン状態へ遷移するようにしています。

また、一度ダウン状態になった pgpool-II は原因調査の後手動で再起動することを前提
としているため、WS01 を再起動しただけでは状態は元に戻りません。

そのため trusted_servers には常にアクセス可能であることが前提のサーバを指定する
必要があります。ただし、複数のサーバをカンマ区切りで指定可能であり、その内どれか
1つでもアクセス可能であれば障害発生とはみなされません。

> 
> ちなみに、WS01をシャットダウンした状態でDB01-DB02間でpingが通ることも確認しました。
> 
> 以上、宜しくお願いします。


-- 
Yugo Nagata <nagata @ sraoss.co.jp>


pgpool-general-jp メーリングリストの案内