<div dir="ltr"><div>Hi,</div><div><br></div><div>When performing an restart on a primary pgpool node, and vip transfer to the 2nd node, but when the faulty primary boots up, it  declare itself as the only node in the cluster and brings up the VIP (duplicate IP)!!</div><div> </div><div><br></div><div>the 1st node (startup):</div><div><div>2016-08-11 17:31:36: pid 1761: WARNING:  checking setuid bit of if_up_cmd</div><div>2016-08-11 17:31:36: pid 1761: DETAIL:  ifup[/sbin/ifconfig] doesn&#39;t have setuid bit</div><div>2016-08-11 17:31:36: pid 1761: WARNING:  checking setuid bit of if_down_cmd</div><div>2016-08-11 17:31:36: pid 1761: DETAIL:  ifdown[/sbin/ifconfig] doesn&#39;t have setuid bit</div><div>2016-08-11 17:31:36: pid 1761: WARNING:  checking setuid bit of arping command</div><div>2016-08-11 17:31:36: pid 1761: DETAIL:  arping[/sbin/arping] doesn&#39;t have setuid bit</div><div>2016-08-11 17:31:36: pid 1761: LOG:  waiting for watchdog to initialize</div><div>2016-08-11 17:31:36: pid 1767: LOG:  setting the local watchdog node name to &quot;Linux_mgrdb84_9999&quot;</div><div>2016-08-11 17:31:36: pid 1767: LOG:  watchdog cluster configured with 1 remote nodes</div><div>2016-08-11 17:31:36: pid 1767: LOG:  watchdog remote node:0 on <a href="http://1.1.1.85:9000">1.1.1.85:9000</a></div><div>2016-08-11 17:31:36: pid 1767: LOG:  interface monitoring is disabled in watchdog</div><div>2016-08-11 17:31:36: pid 1767: LOG:  IPC socket path: &quot;/tmp/.s.PGPOOLWD_CMD.9000&quot;</div><div>2016-08-11 17:31:41: pid 1767: LOG:  watchdog node state changed from [LOADING] to [JOINING]</div><div>2016-08-11 17:31:46: pid 1767: LOG:  watchdog node state changed from [JOINING] to [INITIALIZING]</div><div><b>2016-08-11 17:31:47: pid 1767: LOG:  I am the only alive node in the watchdog cluster</b></div><div>2016-08-11 17:31:47: pid 1767: HINT:  skiping stand for coordinator state</div><div>2016-08-11 17:31:47: pid 1767: LOG:  watchdog node state changed from [INITIALIZING] to [MASTER]</div><div>2016-08-11 17:31:47: pid 1767: LOG:  I am announcing my self as master/coordinator watchdog node</div><div>2016-08-11 17:31:48: pid 1767: LOG:  new watchdog node connection is received from &quot;<a href="http://1.1.1.85:37022">1.1.1.85:37022</a>&quot;</div><div>2016-08-11 17:31:48: pid 1767: LOG:  quorum is complete after node &quot;Linux_mgrdb85_9999&quot; joined the cluster</div><div>2016-08-11 17:31:48: pid 1767: DETAIL:  starting escalation process</div><div>2016-08-11 17:31:48: pid 1767: LOG:  escalation process started with PID:2087</div><div>2016-08-11 17:31:48: pid 2087: LOG:  watchdog: escalation started</div><div>2016-08-11 17:31:50: pid 2087: WARNING:  watchdog failed to bring up delegate IP, &#39;if_up_cmd&#39; failed</div><div>2016-08-11 17:31:50: pid 2087: WARNING:  watchdog de-escalation failed to bring down delegate IP</div><div>2016-08-11 17:31:50: pid 1767: LOG:  watchdog escalation process with pid: 2087 exit with SUCCESS.</div><div>2016-08-11 17:31:51: pid 1767: LOG:  new outbond connection to <a href="http://1.1.1.85:9000">1.1.1.85:9000</a></div><div>2016-08-11 17:31:53: pid 1767: LOG:  I am the cluster leader node</div><div>2016-08-11 17:31:53: pid 1767: DETAIL:  our declare coordinator message is accepted by all nodes</div><div>2016-08-11 17:31:53: pid 1761: LOG:  watchdog process is initialized</div><div>2016-08-11 17:31:53: pid 1767: LOG:  new IPC connection received</div><div>2016-08-11 17:31:53: pid 1761: LOG:  Setting up socket for <a href="http://0.0.0.0:9999">0.0.0.0:9999</a></div><div>2016-08-11 17:31:53: pid 1761: LOG:  Setting up socket for :::9999</div><div>2016-08-11 17:31:53: pid 2103: LOG:  2 watchdog nodes are configured for lifecheck</div><div>2016-08-11 17:31:53: pid 2103: LOG:  watchdog nodes ID:0 Name:&quot;Linux_mgrdb84_9999&quot;</div><div>2016-08-11 17:31:53: pid 2103: DETAIL:  Host:&quot;1.1.1.84&quot; WD Port:9000 pgpool-II port:9999</div><div>2016-08-11 17:31:53: pid 2103: LOG:  watchdog nodes ID:1 Name:&quot;Linux_mgrdb85_9999&quot;</div><div>2016-08-11 17:31:53: pid 2103: DETAIL:  Host:&quot;1.1.1.85&quot; WD Port:9000 pgpool-II port:9999</div><div>2016-08-11 17:31:53: pid 1761: LOG:  pgpool-II successfully started. version 3.5.3 (ekieboshi)</div><div>2016-08-11 17:31:53: pid 1761: LOG:  find_primary_node: checking backend no 0</div><div>2016-08-11 17:31:53: pid 1761: LOG:  find_primary_node: primary node id is 0</div><div>2016-08-11 17:31:54: pid 2105: LOG:  createing watchdog heartbeat receive socket.</div><div>2016-08-11 17:31:54: pid 2105: DETAIL:  bind receive socket to device: &quot;eth1&quot;</div><div>2016-08-11 17:31:54: pid 2105: LOG:  set SO_REUSEPORT option to the socket</div><div>2016-08-11 17:31:54: pid 2105: LOG:  creating watchdog heartbeat receive socket.</div><div>2016-08-11 17:31:54: pid 2105: DETAIL:  set SO_REUSEPORT</div><div>2016-08-11 17:31:54: pid 2107: LOG:  creating socket for sending heartbeat</div><div>2016-08-11 17:31:54: pid 2107: DETAIL:  bind send socket to device: eth1</div><div>2016-08-11 17:31:54: pid 2107: LOG:  set SO_REUSEPORT option to the socket</div><div>2016-08-11 17:31:54: pid 2107: LOG:  creating socket for sending heartbeat</div><div>2016-08-11 17:31:54: pid 2107: DETAIL:  set SO_REUSEPORT</div><div>2016-08-11 17:33:33: pid 2103: LOG:  watchdog: lifecheck started</div><div>2016-08-11 17:36:31: pid 1761: LOG:  child process with pid: 2254 exits with status 256</div><div>2016-08-11 17:36:31: pid 1761: LOG:  fork a new child process with pid: 3193</div></div><div><br></div><div><br></div><div>the 2nd node:</div><div><br></div><div><b>2016-08-11 17:17:34: pid 16256: WARNING:  checking setuid bit of if_up_cmd</b></div><div>2016-08-11 17:17:34: pid 16256: DETAIL:  ifup[/sbin/ifconfig] doesn&#39;t have setuid bit</div><div><b>2016-08-11 17:17:34: pid 16256: WARNING:  checking setuid bit of if_down_cmd</b></div><div>2016-08-11 17:17:34: pid 16256: DETAIL:  ifdown[/sbin/ifconfig] doesn&#39;t have setuid bit</div><div><b>2016-08-11 17:17:34: pid 16256: WARNING:  checking setuid bit of arping command</b></div><div>2016-08-11 17:17:34: pid 16256: DETAIL:  arping[/sbin/arping] doesn&#39;t have setuid bit</div><div>2016-08-11 17:17:34: pid 16256: LOG:  reading status file: 1 th backend is set to down status</div><div>2016-08-11 17:17:34: pid 16256: LOG:  waiting for watchdog to initialize</div><div>2016-08-11 17:17:34: pid 16258: LOG:  setting the local watchdog node name to &quot;Linux_mgrdb84_9999&quot;</div><div>2016-08-11 17:17:34: pid 16258: LOG:  watchdog cluster configured with 1 remote nodes</div><div>2016-08-11 17:17:34: pid 16258: LOG:  watchdog remote node:0 on <a href="http://1.1.1.85:9000">1.1.1.85:9000</a></div><div>2016-08-11 17:17:34: pid 16258: LOG:  interface monitoring is disabled in watchdog</div><div>2016-08-11 17:17:34: pid 16258: LOG:  IPC socket path: &quot;/tmp/.s.PGPOOLWD_CMD.9000&quot;</div><div>2016-08-11 17:17:38: pid 16258: LOG:  watchdog node state changed from [LOADING] to [JOINING]</div><div>2016-08-11 17:17:43: pid 16258: LOG:  watchdog node state changed from [JOINING] to [INITIALIZING]</div><div>2016-08-11 17:17:44: pid 16258: LOG:  I am the only alive node in the watchdog cluster</div><div>2016-08-11 17:17:44: pid 16258: HINT:  skiping stand for coordinator state</div><div>2016-08-11 17:17:44: pid 16258: LOG:  watchdog node state changed from [INITIALIZING] to [MASTER]</div><div>2016-08-11 17:17:44: pid 16258: LOG:  I am announcing my self as master/coordinator watchdog node</div><div>2016-08-11 17:17:49: pid 16258: LOG:  I am the cluster leader node</div><div>2016-08-11 17:17:49: pid 16258: DETAIL:  our declare coordinator message is accepted by all nodes</div><div>2016-08-11 17:17:49: pid 16258: LOG:  I am the cluster leader node. Starting escalation process</div><div>2016-08-11 17:17:49: pid 16256: LOG:  watchdog process is initialized</div><div>2016-08-11 17:17:49: pid 16258: LOG:  escalation process started with PID:16262</div><div>2016-08-11 17:17:49: pid 16262: LOG:  watchdog: escalation started</div><div>2016-08-11 17:17:49: pid 16258: LOG:  new IPC connection received</div><div>0:9999</div><div>-11 17:17:49: pid 16256: LOG:  Setting up socket for :::9999</div><div>2016-08-11 17:17:49: pid 16263: LOG:  2 watchdog nodes are configured for lifecheck</div><div>2016-08-11 17:17:49: pid 16263: LOG:  watchdog nodes ID:0 Name:&quot;Linux_mgrdb84_9999&quot;</div><div>2016-08-11 17:17:49: pid 16263: DETAIL:  Host:&quot;1.1.1.84&quot; WD Port:9000 pgpool-II port:9999</div><div>2016-08-11 17:17:49: pid 16263: LOG:  watchdog nodes ID:1 Name:&quot;Not_Set&quot;</div><div>2016-08-11 17:17:49: pid 16263: DETAIL:  Host:&quot;1.1.1.85&quot; WD Port:9000 pgpool-II port:9999</div><div>2016-08-11 17:17:49: pid 16256: LOG:  pgpool-II successfully started. version 3.5.3 (ekieboshi)</div><div>2016-08-11 17:17:49: pid 16256: LOG:  find_primary_node: checking backend no 0</div><div>2016-08-11 17:17:49: pid 16256: LOG:  find_primary_node: primary node id is 0</div><div>2016-08-11 17:17:50: pid 16267: LOG:  createing watchdog heartbeat receive socket.</div><div>2016-08-11 17:17:50: pid 16267: DETAIL:  bind receive socket to device: &quot;eth1&quot;</div><div>2016-08-11 17:17:50: pid 16269: LOG:  set SO_REUSEPORT option to the socket</div><div>2016-08-11 17:17:50: pid 16269: LOG:  creating socket for sending heartbeat</div><div>2016-08-11 17:17:50: pid 16269: DETAIL:  set SO_REUSEPORT</div><div>EPORT</div><div><b>2016-08-11 17:17:51: pid 16262: WARNING:  watchdog failed to bring up delegate IP, &#39;if_up_cmd&#39; failed</b></div><div><b>2016-08-11 17:17:51: pid 16262: WARNING:  watchdog de-escalation failed to bring down delegate IP</b></div><div>2016-08-11 17:17:51: pid 16258: LOG:  watchdog escalation process with pid: 16262 exit with SUCCESS.</div><div>2016-08-11 17:18:09: pid 16256: LOG:  child process with pid: 16423 exits with status 256</div><div>2016-08-11 17:18:09: pid 16256: LOG:  fork a new child process with pid: 16476</div><div><br></div><div><br></div><div><br></div><div><br></div><div>Please advice,</div><div>cohavisi</div></div>