<div dir="ltr">Hi all,<div><br></div><div>I&#39;ve two pgpool 3.6.1 on Centos 7, configured to share a delegate IP.</div><div>We&#39;re trying to assess the viability of escalation/de-escalation in case of network failure or simply when one of the pgpool is shut down to perform mainteinance.</div><div><br></div><div>Our test consists of shutting down MASTER pgpool and let the other escalate.</div><div>Escalation always worked correctly, but de-escalation on shutting down instance sometimes did not bring down delegate IP correctly.</div><div>The final results is that both nodes ends up having delegate IP.</div><div><br></div><div>Looking at the logs, when de-escalation worked there is a log line saying &quot;watchdog: de-escalation started&quot;. This line is emitted in fork_plunging_process in watchdog/wd_escalation.c.</div><div><br></div><div>On the contrary, when de-escalation did not work, this line did not appear in the log.</div><div><br></div><div>I&#39;ve added some more verbose log and found that in problematic cases fork_plunging_process does not complete.</div><div>If I add an ereport immediately before </div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">   POOL_SETMASK(&amp;UnBlockSig);</span><br></span></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif">and one immediately after, the second one is never executed, as the process were killed beforehand.</font></span></div><div><font color="#000000" face="arial, helvetica, sans-serif">I&#39;m not familiar with the code but it seems that signal 15 is unblocked at least for a short window of time.</font></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif"><br></font></span></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif">In my private setup this bug is quite difficult to reproduce.</font></span></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif">Thanks to Murphy&#39;s law, in our customer setup it happens in more than half of cases.</font></span></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif"><br></font></span></div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif">This seems to be a bug.</font></span></div><div>Should I open a ticket?</div><div><span style="color:rgb(0,0,0)"><font face="arial, helvetica, sans-serif"><br></font></span></div><div>Best regards,</div><div><br></div><div>Gabriele Monfardini</div><div><br></div><div><div><div class="gmail_signature"><div dir="ltr"><div>-----<br>Gabriele Monfardini<br>LdP Progetti GIS</div><div>tel: 0577.531049<br>email: <a href="mailto:monfardini@ldpgis.it" target="_blank">monfardini@ldpgis.it</a></div></div></div></div>
</div></div>