<div dir="ltr">This one worked thanks.</div><div class="gmail_extra"><br clear="all"><div><div style="color:rgb(136,136,136);font-family:arial,sans-serif;font-size:13px;background-color:rgb(255,255,255)">Nathan Brennan | Senior Software Engineer</div>
<div style="color:rgb(136,136,136);font-family:arial,sans-serif;font-size:13px;background-color:rgb(255,255,255)"><img src="http://healthengine.com.au/images/he_sig.jpg"><br></div><div style="color:rgb(136,136,136);font-family:arial,sans-serif;font-size:13px;background-color:rgb(255,255,255)">
This message and any attachments contain confidential information and is intended only for the individual named. If you are not the named addressee you should not disseminate, distribute or copy this e-mail or attachments (if any). Please notify the sender immediately by e-mail if you have received this e-mail by mistake and delete this e-mail and attachments (if any) from your system. E-mail transmission cannot be guaranteed to be secure or error-free as information could be intercepted, corrupted, lost, destroyed, arrive late or incomplete, or contain viruses. The sender therefore does not accept liability for any errors or omissions in the contents or attachments (if any) of this message, which arise as a result of e-mail transmission.</div>
</div>
<br><br><div class="gmail_quote">On Tue, Jul 23, 2013 at 9:52 PM, Tatsuo Ishii <span dir="ltr">&lt;<a href="mailto:ishii@postgresql.org" target="_blank">ishii@postgresql.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Looks baseback.sh coming with the doc is broken.<br>
<br>
Can you please try another one which comes with the tutorial on the<br>
pgpool wiki? (<a href="http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/index.html" target="_blank">http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/index.html</a>)<br>
<br>
<a href="http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/basebackup.sh" target="_blank">http://www.pgpool.net/pgpool-web/contrib_docs/simple_sr_setting2/basebackup.sh</a><br>
--<br>
Tatsuo Ishii<br>
SRA OSS, Inc. Japan<br>
English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>
Japanese: <a href="http://www.sraoss.co.jp" target="_blank">http://www.sraoss.co.jp</a><br>
<div class="HOEnZb"><div class="h5"><br>
&gt; Hi,<br>
&gt;<br>
&gt; I&#39;m trying to do online recovery with master/slave replication and I&#39;m<br>
&gt; basically copying<br>
&gt; <a href="http://www.pgpool.net/docs/latest/pgpool-en.html#master_slave_mode" target="_blank">http://www.pgpool.net/docs/latest/pgpool-en.html#master_slave_mode</a> but I<br>
&gt; can&#39;t figure out how the users work and seem to be getting a &quot;host key<br>
&gt; verification failed&quot; issue.<br>
&gt;<br>
&gt; Following the steps I setup the recovery_user and recovery_password for<br>
&gt; this I used the postgresql user &quot;postgres&quot; which I set a password for in<br>
&gt; the database and not the ubuntu user which seems to work, is this correct ?<br>
&gt;<br>
&gt; It then says you need to be able to ssh from the primary to the standby<br>
&gt; which I assume uses the user postgres. I have ssh keys setup so I can<br>
&gt; connect from the primary to the standby like so:<br>
&gt; ssh standby as user postres works fine.<br>
&gt;<br>
&gt; I have created the basebackup.sh file however I&#39;m not sure why this line<br>
&gt; uses localhost shouldn&#39;t it be $desthost ?<br>
&gt; ssh -T localhost mv $destdir/recovery.done $destdir/recovery.conf<br>
&gt;<br>
&gt; I have installed pgpool-recovery and updated pgpool_remote_start to use<br>
&gt; /usr/lib/postgresql/9.1/bin/ instead of /usr/local/pgsql/bin/pg_ctl<br>
&gt;<br>
&gt;<br>
&gt; now when I run pcp_recovery_node like so this is my pgpool console debug<br>
&gt; output<br>
&gt;<br>
&gt; pcp_recovery_node -d 10 localhost 9898 postgres postgres 1<br>
&gt; DEBUG: send: tos=&quot;R&quot;, len=46<br>
&gt; DEBUG: recv: tos=&quot;r&quot;, len=21, data=AuthenticationOK<br>
&gt; DEBUG: send: tos=&quot;D&quot;, len=6<br>
&gt; DEBUG: recv: tos=&quot;e&quot;, len=20, data=recovery failed<br>
&gt; DEBUG: command failed. reason=recovery failed<br>
&gt; BackendError<br>
&gt; DEBUG: send: tos=&quot;X&quot;, len=4<br>
&gt;<br>
&gt;<br>
&gt; postgresql primary log<br>
&gt;<br>
&gt;  pg_start_backup<br>
&gt; -----------------<br>
&gt;  0/12000020<br>
&gt; (1 row)<br>
&gt;<br>
&gt; Host key verification failed.<br>
&gt; NOTICE:  WAL archiving is not enabled; you must ensure that all required<br>
&gt; WAL segments are copied through other means to complete the backup<br>
&gt;  pg_stop_backup<br>
&gt; ----------------<br>
&gt;  0/120000D8<br>
&gt;<br>
&gt;<br>
&gt; pgpool log<br>
&gt;<br>
&gt; 2013-07-23 10:09:36 LOG:   pid 7547: starting recovering node 1<br>
&gt; 2013-07-23 10:09:36 LOG:   pid 7547: starting recovery command: &quot;SELECT<br>
&gt; pgpool_recovery(&#39;basebackup.sh&#39;, &#39;10.0.11.150&#39;,<br>
&gt; &#39;/var/lib/postgresql/9.1/main/&#39;)&quot;<br>
&gt; 2013-07-23 10:09:37 LOG:   pid 7547: 1st stage is done<br>
&gt; 2013-07-23 10:09:37 LOG:   pid 7547: check_postmaster_started: try to<br>
&gt; connect to postmaster on hostname:10.0.11.150 database:postgres<br>
&gt; user:postgres (retry 0 times)<br>
&gt; 2013-07-23 10:09:37 LOG:   pid 7547: check_postmaster_started: failed to<br>
&gt; connect to postmaster on hostname:10.0.11.150 database:postgres<br>
&gt; user:postgres<br>
&gt;<br>
&gt;<br>
&gt; the check_postmaster_started just keeps repeating for 90seconds which is<br>
&gt; the timeout.<br>
&gt;<br>
&gt; postgres standby startup log<br>
&gt;<br>
&gt; 2013-07-23 10:18:17 UTC LOG:  database system was interrupted; last known<br>
&gt; up at 2013-07-23 10:13:35 UTC<br>
&gt; 2013-07-23 10:18:17 UTC LOG:  could not open file<br>
&gt; &quot;pg_xlog/000000010000000000000015&quot; (log file 0, segment 21): No s<br>
&gt;  uch file or directory<br>
&gt; 2013-07-23 10:18:17 UTC LOG:  invalid checkpoint record<br>
&gt; 2013-07-23 10:18:17 UTC FATAL:  could not locate required checkpoint record<br>
&gt; 2013-07-23 10:18:17 UTC HINT:  If you are not restoring from a backup, try<br>
&gt; removing the file &quot;/var/lib/postgresql/9          .1/main/backup_label&quot;.<br>
&gt; 2013-07-23 10:18:17 UTC LOG:  startup process (PID 7020) exited with exit<br>
&gt; code 1<br>
&gt; 2013-07-23 10:18:17 UTC LOG:  aborting startup due to startup process<br>
&gt; failure<br>
&gt;<br>
&gt;<br>
&gt; basically it looks like it started to copy the files then fails ?<br>
</div></div></blockquote></div><br></div>