<div dir="ltr">You said: &quot;<span style="font-family:arial,sans-serif;font-size:13px">I killed server2 pgpool-II parent process by kill -9&quot;</span><div class="gmail_extra">Try &quot;killall -9 pgpool&quot; in active server...</div>
<div class="gmail_extra">The stand by will grow up the delegate IP and the same will still on old active server and will conflict.</div><div class="gmail_extra">So I am using a shell script in crontab to check this and restart pgpool if necessary.</div>
<div class="gmail_extra"><br><br><div class="gmail_quote">2013/8/12 Tatsuo Ishii <span dir="ltr">&lt;<a href="mailto:ishii@postgresql.org" target="_blank">ishii@postgresql.org</a>&gt;</span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">&gt; On 08/05/13 14:07, Fernando Buzon wrote:<br>
&gt;&gt;<br>
&gt;&gt; FINAL:<br>
&gt;&gt; Like I said, all is working nice.<br>
&gt;&gt; And now I am with the 2 pgpools up and working again.<br>
&gt;&gt; The escaled pgpool is pgpool-01.<br>
&gt;&gt; I stop it with &quot;killall -9 pgpool&quot; and now wd_lifecheck worked fine on<br>
&gt;&gt; pgpool-02!<br>
&gt;&gt; I dont now what was the problem early, but now is working!<br>
&gt;&gt;<br>
&gt;<br>
&gt; Maybe you fix some small issue in the config during your testing.<br>
&gt;<br>
&gt;&gt; log on pgpool-02:<br>
&gt;&gt; 2013-08-05 17:52:42 LOG:   pid 11524: wd_lifecheck: lifecheck failed 3<br>
</div>&gt;&gt; times. pgpool 1 (<a href="http://10.0.0.21:5432" target="_blank">10.0.0.21:5432</a> &lt;<a href="http://10.0.0.21:5432" target="_blank">http://10.0.0.21:5432</a>&gt;) seems not to be working<br>
<div class="im">&gt;&gt; 2013-08-05 17:52:42 LOG:   pid 11524: wd_escalation: escalated to master pgpool<br>
&gt;&gt; 2013-08-05 17:52:42 LOG:   pid 11524: wd_escalation:  escalated to<br>
&gt;&gt; delegate_IP holder<br>
&gt;&gt; 2013-08-05 17:52:52 LOG:   pid 11524: wd_lifecheck: lifecheck failed 3<br>
</div>&gt;&gt; times. pgpool 1 (<a href="http://10.0.0.21:5432" target="_blank">10.0.0.21:5432</a> &lt;<a href="http://10.0.0.21:5432" target="_blank">http://10.0.0.21:5432</a>&gt;) seems not to be working<br>
<div class="im">&gt;&gt;<br>
&gt;&gt; So rest only one problem, that is how to down delegate_ip from the pgpool-01?<br>
&gt;&gt; Because both servers is responding to delegate_ip.<br>
&gt;<br>
&gt; Well, the reason it doesn&#39;t get removed on pgpool-01 is because the killall -9<br>
&gt; kills the pgpool processes including the watchdog without any hope of them<br>
&gt; running the ifconfig down command.<br>
&gt;<br>
&gt; That said, you just need to run the ifconfig down command on pgpool-01.<br>
&gt;<br>
&gt; I&#39;m sure what you&#39;re trying to simulate is a crash, but I&#39;m not sure killing<br>
&gt; ALL the pgpool processes with -9 is a good simulation, because more likely<br>
&gt; only one of the backends would crash.<br>
&gt;<br>
&gt; Maybe one of the other folks on the list can suggest a better simulation for a<br>
&gt; crashing pgpool service.<br>
<br>
</div>I have tried with pgpool-II 3.3.0 to test the case. Initially<br>
&quot;server2&quot; is the watchdog active, and &quot;server1&quot; is the watchdog<br>
&quot;standby&quot;.<br>
<br>
I killed server2 pgpool-II parent process by kill -9.<br>
<br>
- server2 releases the VIP. server2 watchdog goes to &quot;down&quot; status.<br>
<br>
- server1 becomes active and grab the VIP.<br>
<br>
So my guess is, 3.2&#39;s watchdog is not capable to handle the situation.<br>
<br>
Pgpool-II 3.3&#39;s watchdog is much more enhanced than 3.2&#39;s. I recommend<br>
to use 3.3 if you want to seriously use watchdog.<br>
--<br>
Tatsuo Ishii<br>
SRA OSS, Inc. Japan<br>
English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>
Japanese: <a href="http://www.sraoss.co.jp" target="_blank">http://www.sraoss.co.jp</a><br>
</blockquote></div><br></div></div>