<div dir="ltr">thanks for response, <div><br></div><div>I&#39;l try and get back with more log. </div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Aug 29, 2013 at 5:30 PM, Tatsuo Ishii <span dir="ltr">&lt;<a href="mailto:ishii@postgresql.org" target="_blank">ishii@postgresql.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Health check was ok, but one of child process(pid 15210) could not<br>
read/write a socket to PostgreSQL.  That&#39;s the reason of fail over.  I<br>
cannot guess the cause of the error from the log. Maybe PostgreSQL<br>
problem or network error? (in this case you should see an error in<br>
PostgreSQL log).<br>
<br>
In the mean time you should consider to turn off this:<br>
<br>
fail_over_on_backend_error = on<br>
                                   # Initiates failover when reading/writing to the<br>
                                   # backend communication socket fails<br>
                                   # If set to off, pgpool will report an<br>
                                   # error and disconnect the session.<br>
--<br>
Tatsuo Ishii<br>
SRA OSS, Inc. Japan<br>
English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>
Japanese: <a href="http://www.sraoss.co.jp" target="_blank">http://www.sraoss.co.jp</a><br>
<div class="HOEnZb"><div class="h5"><br>
&gt; Hello,<br>
&gt;<br>
&gt; I&#39;m having problem with failover triggering every night because for me<br>
&gt; unknown reason. I have latest pgpool-3.3.0 version with postgresql 9.0<br>
&gt; nodes.<br>
&gt;<br>
&gt; I have streaming replication and load balance, without watchdog.<br>
&gt; I have enabled healt check with this paremeters:<br>
&gt;<br>
&gt; health_check_period = 5<br>
&gt; health_check_timeout = 20<br>
&gt; health_check_user = &#39;postgres&#39;<br>
&gt; health_check_max_retries = 1<br>
&gt; health_check_retry_delay = 1<br>
&gt;<br>
&gt;<br>
&gt; Here is my pgpool.log with debug option enabled:<br>
&gt;<br>
&gt; 2013-08-28 05:15:23 DEBUG: pid 10079: s_do_auth: auth kind: 0<br>
&gt; 2013-08-28 05:15:23 DEBUG: pid 10079: s_do_auth: backend key data received<br>
&gt; 2013-08-28 05:15:23 DEBUG: pid 10079: s_do_auth: transaction state: I<br>
&gt; 2013-08-28 05:15:23 DEBUG: pid 10079: health check: clearing alarm<br>
&gt; 2013-08-28 05:15:23 DEBUG: pid 10079: health check: clearing alarm<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: starting health checking<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: health check: clearing alarm<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: health_check: 0 th DB node status: 2<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: pool_ssl: SSL requested but SSL<br>
&gt; support is not available<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: auth kind: 0<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: backend key data received<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: transaction state: I<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: health_check: 1 th DB node status: 2<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: pool_ssl: SSL requested but SSL<br>
&gt; support is not available<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: auth kind: 0<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: backend key data received<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: s_do_auth: transaction state: I<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: health check: clearing alarm<br>
&gt; 2013-08-28 05:15:28 DEBUG: pid 10079: health check: clearing alarm<br>
&gt; 2013-08-28 05:15:29 ERROR: pid 15210: pool_read: read failed (Connection<br>
&gt; timed out)<br>
&gt; 2013-08-28 05:15:29 LOG:   pid 15210: degenerate_backend_set: 0 fail over<br>
&gt; request from pid 15210<br>
&gt; 2013-08-28 05:15:29 ERROR: pid 15210: pool_flush_it: write failed to<br>
&gt; backend (0). reason: Broken pipe offset: 0 wlen: 5<br>
&gt; 2013-08-28 05:15:29 DEBUG: pid 10079: failover_handler called<br>
&gt; 2013-08-28 05:15:29 DEBUG: pid 10079: failover_handler: starting to select<br>
&gt; new master node<br>
&gt; 2013-08-28 05:15:29 LOG:   pid 10079: starting degeneration. shutdown host<br>
&gt; intrix-c1(5432)<br>
&gt; 2013-08-28 05:15:29 LOG:   pid 10079: Restart all children<br>
&gt; 2013-08-28 05:15:29 DEBUG: pid 10079: failover_handler: kill 18940<br>
&gt; 2013-08-28 05:15:29 DEBUG: pid 10079: failover_handler: kill 10507<br>
&gt; 2013-08-28 05:15:29 DEBUG: pid 10079: failover_handler: kill 2139<br>
&gt;<br>
&gt; --<br>
&gt; Armin<br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>Armin
</div>