<div dir="ltr"><div>Hello Muhammad Usama.<br></div>Thank you for help<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Feb 25, 2016 at 1:22 PM, Muhammad Usama <span dir="ltr">&lt;<a href="mailto:m.usama@gmail.com" target="_blank">m.usama@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><br>On Thu, Feb 25, 2016 at 12:59 AM, Lucas Luengas &lt;<a href="mailto:lucasluengas@gmail.com" target="_blank">lucasluengas@gmail.com</a>&gt; wrote:<br>&gt; Hello.<br>&gt;<br>&gt; I am using pgpool-II version 3.4.4 (tataraboshi), with master/slave with<br>&gt; streaming replication, and watchdog. I am using Centos 6.7.<br>&gt; I have 2 nodes: node A and node B.<br>&gt; Failover process is ok.<br>&gt; Virtual ip address is assigned ok between nodes if nodes are restarted. But<br>&gt; I have a problem with watchdog process if one node is disconnected of<br>&gt; network.<br>&gt; If node A is disconected from network (for example cable is disconnected),<br>&gt; then virtual ip address is assigned to node B. That is ok.<br>&gt; After a few minutes, node A is connected to network again. My problem is<br>&gt; than pgpool watchdog process of node A does not connect with node B, but<br>&gt; network is ok (ping ok, netstat listening ports (9999, 9898, ...) are ok,<br>&gt; ...).<br>&gt; And node B does not connect with node A.<br>&gt;<br>&gt; Pgpool log of node A shows every 10 seconds: (ip 192.168.0.226 is node B)<br>&gt;<br>&gt; pid 16913: LOG:  checking pgpool status by heartbeat<br>&gt; pid 16913: DETAIL:  pgpool: 1 at &quot;<a href="http://192.168.0.226:9999" target="_blank">192.168.0.226:9999</a>&quot; status is down<br>&gt;<br>&gt; pgpool log of node B shows every 10 seconds: (ip 192.168.0.224 is node A)<br>&gt;<br>&gt; pid 8722: LOG:  checking pgpool status by heartbeat<br>&gt; pid 8722: DETAIL:  pgpool: 1 at &quot;<a href="http://192.168.0.224:9999" target="_blank">192.168.0.224:9999</a>&quot; status is down<br>&gt;<br>&gt; I can use pcp_watchdog_info command in both servers. In node A, status of<br>&gt; node B is 4 (down). In node B, status of node A is 4 (down)<br>&gt;<br>&gt; If I restart pgpool service in node A, then pgpool watchdog process is ok<br>&gt; again and status are ok for both nodes, and pgpool watchdog is recovered in<br>&gt; both nodes.<br>&gt;<br>&gt; What is the problem?<br><br>This is the expected behaviour of pgpool-II watchdog, When the watchdog communication with the other pgpool-II node is lost. The watchdog marks the other node&#39;s status as DOWN, And only restart of the other node can make the node rejoin the watchdog cluster.<br>You can manapulate the pgpool-II configuration parameters <i>wd_heartbeat_deadtime</i> and <i>wd_interval</i> to swollow the temporary network glitches but once the watchdog node status is marked as down only the restart of the other pgpool-II can make the node connected again.<div><br><div><br></div><div>Regards</div><div>Muhammad Usama</div><div><br></div><div><div><br>&gt;<br>&gt; Thank you for your help.<br>&gt;<br>&gt;<br>&gt;<br>&gt; _______________________________________________<br>&gt; pgpool-general mailing list<br>&gt; <a href="mailto:pgpool-general@pgpool.net" target="_blank">pgpool-general@pgpool.net</a><br>&gt; <a href="http://www.pgpool.net/mailman/listinfo/pgpool-general" target="_blank">http://www.pgpool.net/mailman/listinfo/pgpool-general</a><br>&gt;</div></div></div></div>
</blockquote></div><br></div>