[pgpool-general-jp: 1220] Re: watchdogのtrusted_serverの動きについて
Yugo Nagata
nagata @ sraoss.co.jp
2013年 11月 6日 (水) 19:53:22 JST
長田です。
返信が遅くなり申し訳ありません。
On Thu, 31 Oct 2013 19:01:25 +0900
Takanori Urata <takanori.urata @ thot.co.jp> wrote:
> to:pgpool-general-jp メーリングリスト 御中
>
> pgpool-II 3.3.1のwatchdogを下記のように設定しています。
>
> [pgpool.confの抜粋]
> use_watchdog = on
> trusted_servers = 'WS01' <= (DB01 / DB02共同じ)
>
> wd_hostname = 'DB01'
> wd_lifecheck_method = 'heartbeat'
> heartbeat_destination0 = 'DB02'
>
> other_pgpool_hostname0 = 'DB02'
>
> この時、WS01とシャットダウンするとpcp_watchdog_infoコマンドのステータスが”4”になります。
>
> しかし、WS01を再起動してもpgpool-IIの状態は変化しません。
>
> 死活監視はheartbeatでDB01-DB02間でも行われているのではないでしょうか?
> なぜ、WS01がシャットダウンした段階で、pgpool-IIのステータスが"4(ダウン)"になってしまうのでしょうか?
上位サーバ(trusted_servers に指定したサーバをそう呼んでいます)への接続
が失敗した場合、上位サーバに障害が発生した可能性も考えられるのですが、
これは回線障害や pgpool-II サーバの障害と切り分けられないため、現状の
実装では pgpool-II 自体がダウン状態へ遷移するようにしています。
また、一度ダウン状態になった pgpool-II は原因調査の後手動で再起動することを前提
としているため、WS01 を再起動しただけでは状態は元に戻りません。
そのため trusted_servers には常にアクセス可能であることが前提のサーバを指定する
必要があります。ただし、複数のサーバをカンマ区切りで指定可能であり、その内どれか
1つでもアクセス可能であれば障害発生とはみなされません。
>
> ちなみに、WS01をシャットダウンした状態でDB01-DB02間でpingが通ることも確認しました。
>
> 以上、宜しくお願いします。
--
Yugo Nagata <nagata @ sraoss.co.jp>
pgpool-general-jp メーリングリストの案内