<div dir="ltr"><div><div><div><div><div>Hi Tatsuo,<br></div>Thank you so much for your reply.<br>Actually in my case, i was using the pcp_recovery command and execute it on the current primary server. <br></div>However, if the remote node (recover node) database is off, i got the following message on the primary server pgpool log:<br>
<br>Jan 31 16:58:10 server0 pgpool[2723]: starting recovery command: &quot;SELECT pgpool_recovery(&#39;basebackup.sh&#39;, &#39;server1&#39;, &#39;/opt/postgres/9.2/data&#39;)&quot;<br>Jan 31 16:58:11 server0 pgpool[2723]: 1st stage is done<br>
Jan 31 16:58:11 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:postgres user:postgres (retry 0 times)<br>Jan 31 16:58:11 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:postgres user:postgres<br>
Jan 31 16:58:13 server0 pgpool[2719]: connection received: host=server0.local port=58446<br>Jan 31 16:58:14 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:postgres user:postgres (retry 1 times)<br>
Jan 31 16:58:14 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:postgres user:postgres<br>Jan 31 16:58:14 server0 pgpool[2719]: connection received: host=server1.local port=39928<br>
Jan 31 16:58:17 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:postgres user:postgres (retry 2 times)<br>Jan 31 16:58:17 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:postgres user:postgres<br>
Jan 31 16:58:20 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:postgres user:postgres (retry 3 times)<br>Jan 31 16:58:20 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:postgres user:postgres<br>
Jan 31 16:58:23 server0 pgpool[2719]: connection received: host=server0.local port=58464<br>Jan 31 16:58:23 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 0 times)<br>
Jan 31 16:58:23 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br>Jan 31 16:58:26 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 1 times)<br>
Jan 31 16:58:26 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br>Jan 31 16:58:26 server0 pgpool[2719]: connection received: host=server1.local port=39946<br>
Jan 31 16:58:29 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 2 times)<br>Jan 31 16:58:29 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br>
Jan 31 16:58:32 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 3 times)<br>Jan 31 16:58:32 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br>
Jan 31 16:58:33 server0 pgpool[2719]: connection received: host=server0.local port=58483<br>Jan 31 16:58:35 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 4 times)<br>
Jan 31 16:58:35 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br>Jan 31 16:58:38 server0 pgpool[2723]: check_postmaster_started: try to connect to postmaster on hostname:server1 database:template1 user:postgres (retry 5 times)<br>
Jan 31 16:58:38 server0 pgpool[2723]: check_postmaster_started: failed to connect to postmaster on hostname:server1 database:template1 user:postgres<br><br></div>here is the exact command i execute on server0 to recover server1, /usr/local/bin/pcp_recovery_node 10 localhost 9898 pgpool cisco 1<br>
<br></div>Do you have any idea why?<br><br></div>Just FYI, we cannot pgpoolAdmin in our environment.<br><div><div><br></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Feb 17, 2013 at 12:13 AM, Tatsuo Ishii <span dir="ltr">&lt;<a href="mailto:ishii@postgresql.org" target="_blank">ishii@postgresql.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">&gt; Hi all,<br>
&gt; I have the following question regarding the recovery of a filed Primary<br>
&gt; Database Server.<br>
&gt;<br>
&gt; Question 1: in the documentation, under Streaming Replication Online<br>
&gt; Recovery section.<br>
&gt;<br>
&gt; <a href="http://www.pgpool.net/docs/latest/pgpool-en.html#stream" target="_blank">http://www.pgpool.net/docs/latest/pgpool-en.html#stream</a><br>
&gt;<br>
&gt; in steps 6:<br>
&gt;<br>
</div>&gt;    1. After completing online recovery, pgpool-II will start PostgreSQL on<br>
<div class="im">&gt;    the standby node. Install the script for this purpose on each DB<br>
&gt; nodes. Sample<br>
</div>&gt;    script &lt;<a href="http://www.pgpool.net/docs/latest/pgpool_remote_start" target="_blank">http://www.pgpool.net/docs/latest/pgpool_remote_start</a>&gt; is<br>
<div class="im">&gt;    included in &quot;sample&quot; directory of the source code. This script uses ssh.<br>
&gt;    You need to allow recovery_user to login from the primary node to the<br>
&gt;    standby node without being asked password.<br>
&gt;<br>
&gt; To my understanding, i think the postgreSQL doesn&#39;t not need to be online<br>
&gt; for the recovery process right? Since later on it mentions that<br>
&gt; pgpool_remote_start will start up the DB on the failed node.<br>
<br>
</div>Acually standby PostgreSQL node should not be started.<br>
<div class="im"><br>
&gt; Question 2: in my configuration, i have 2 pgpool server with two backends.<br>
&gt; Will it work for oneline recovery?<br>
<br>
</div>Yes, but online recovery process should be initiated by one of pgpool,<br>
not both. If you enable pgpool-II 3.2&#39;s watchdog, it will take care of<br>
neccessary interlocking.<br>
<div class="im"><br>
&gt; Question 3: when the failed node comes back online, should i use<br>
&gt; pcp_recovery from DB primary or should i use pcp_attach on the failed node<br>
&gt; to recover the failed system? Actually in my case, both methods do not<br>
&gt; recover my system every time.<br>
<br>
</div>I&#39;m confused. Didn&#39;t you start the online recovery process by using<br>
pcp_recovery_node?(of course you could do it via pgpoolAdmin).<br>
<br>
Anyway pcp_recovery_node automatically attach recovered node, and you<br>
don&#39;t need to execute pcp_attach_node.<br>
<br>
I suggest you read tutorial:<br>
<a href="http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/index.html" target="_blank">http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/index.html</a><br>
--<br>
Tatsuo Ishii<br>
SRA OSS, Inc. Japan<br>
English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>
Japanese: <a href="http://www.sraoss.co.jp" target="_blank">http://www.sraoss.co.jp</a><br>
</blockquote></div><br></div>