<div>Ishii さま</div>
<div> </div>
<div>馬鹿な設定でした。マスターを127.0.0.1にしていたことで、マスターをTAKEOVERした</div>
<div>NODEが自分と勘違いしていたようです。IPアドレスの修正で上手くリカバリーしています。</div>
<div>すみません。お騒がせしました。<br><br></div>
<div class="gmail_quote">---------- 転送メッセージ ----------<br>From: <b class="gmail_sendername">ポンパー</b> <span dir="ltr">&lt;<a href="mailto:revivex36@gmail.com">revivex36@gmail.com</a>&gt;</span><br>日付: 2010年10月18日18:07<br>
件名: Fwd: [pgpool-general-jp: 833] Fwd: オンラインリカバリー<br>To: <a href="mailto:pgpool-general-jp@sraoss.jp">pgpool-general-jp@sraoss.jp</a><br><br><br>
<div>お世話になります。</div>
<div> </div>
<div>言われるとうりだとおもっていました。ただPGPOOLが次のマスターNODEをアサインしたときに</div>
<div>は、どの様にして確認すると良いですか? PGPOOLのホストのPOSTGRESを初期設定マスターDB</div>
<div>にしてある状況でPOSTGRESをDOWNさせると、</div>
<div> </div>
<div>backend_hostname0 = &#39;127.0.0.1&#39;<br>backend_port0 = 5433<br>backend_weight0 = 1<br>backend_data_directory0 = &#39;/var/lib/pgsql/data&#39;<br>backend_hostname1 = &#39;111.222.333.4&#39;<br>backend_port1 = 5433<br>
backend_weight1 = 2<br>backend_data_directory1 = &#39;/var/lib/pgsql/data&#39;</div>
<div> </div>
<div>[root@alt02 ~]# /usr/local/bin/pcp_node_info 10 localhost 9898 pgpadmin wwaabb 1<br>113.212.74.8 5433 2 0.666667<br>[root@alt02 ~]# /usr/local/bin/pcp_node_info 10 localhost 9898 pgpadmin wwaabb 0<br>127.0.0.1 5433 3 0.333333</div>

<div> </div>
<div>でNODE0が3でDOWNしたままです。これをPGPOOLADMINからRECOVERYを実行すると</div>
<div> </div>
<div>/usr/local/bin/pcp_recovery_node 10 localhost 9898 pgpadmin waabb 0</div>
<div> </div>
<div>が立ち上がり、PGPOOLのLOGが</div>
<div> </div>
<div>2010-10-18 17:54:48 LOG:   pid 9951: check_postmaster_started: failed to connect to postmaster on hostname:127.0.0.1 database:template1 user:postgres<br>2010-10-18 17:54:51 LOG:   pid 9951: check_postmaster_started: try to connect to postmaster on hostname:127.0.0.1 database:template1 user:postgres (retry 26 times)<br>
2010-10-18 17:54:51 LOG:   pid 9951: check_postmaster_started: failed to connect to postmaster on hostname:127.0.0.1 databas</div>
<div> </div>
<div>を連続して出力しています。</div>
<div> </div>
<div>また、リカバリースクリプトは各NODEから直接相手側のNODEへIP指定して行った場合、全く問題なくリカバリーを</div>
<div>行っています。</div>
<div> </div>
<div>PGPOOLが自分のHOSTにのっかているPOSTGGRESがマスターで、それがDOWNしている事に気がつかずに</div>
<div>127.0.0.1へリカバリー実行を繰り返させているようです。</div>
<div> </div>
<div>どこかの設定が悪いと思うのですが、ご教授お願いします。</div>
<div><br><br> </div>
<div class="gmail_quote">
<div class="im">---------- 転送メッセージ ----------<br>From: <b class="gmail_sendername">Tatsuo Ishii</b> <span dir="ltr">&lt;<a href="mailto:ishii@sraoss.co.jp" target="_blank">ishii@sraoss.co.jp</a>&gt;</span><br></div>日付: 2010年10月18日15:53<br>
件名: Re: [pgpool-general-jp: 833] Fwd: オンラインリカバリー 
<div>
<div></div>
<div class="h5"><br>To: <a href="mailto:pgpool-general-jp@sraoss.jp" target="_blank">pgpool-general-jp@sraoss.jp</a>, <a href="mailto:revivex36@gmail.com" target="_blank">revivex36@gmail.com</a><br><br><br>&gt; モードはREPLICATIONとLOAD BALANCEをTRUEにしてある<br>
&gt; 状態です。<br><br>であれば、マスタがダウンしたときには、pgpool-IIが自動的に新しいマスタを<br>内部的に設定してくれるので、ユーザが設定ファイルをいじるとかする必要は<br>ありません。<br><br>DBノードを設定ファイル順に見ていって、最初に見つかった生きているDBノー<br>ドが新しいマスタになるという単純なルールです。<br><br>&gt; PGPOOLのLOGを見ていると、LOCALのPOSTGRESに<br>
&gt; リカバリーコマンドを送っているような幹事で、最後はFAILになっています。<br><br>リカバリスクリプトの書き方の問題だと思います。もしくは、<br>pcp_recovery_node の引数が間違っているか。<br><br>&gt; PGPOOLとマスターが同じHOSTに同居することを避けるべきなのですか?<br><br>そのマシンやOSがダウンすると、pgpoolもダウンしてしまう以外には問題あり<br>ません。<br>

<div>
<div></div>
<div>--<br>Tatsuo Ishii<br>SRA OSS, Inc. Japan<br>English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>Japanese: <a href="http://www.sraoss.co.jp/" target="_blank">http://www.sraoss.co.jp</a><br>
<br>&gt; オンラインリカバリーのスクリプトを見ていると、それを実行するホストがマスター<br>&gt; になっているように見えます。PGPOOLがバックエンド(マスターDBを含む)の<br>&gt; どれかがDOWNした場合には、もしそれがマスターならば残りのサーバーに<br>&gt; マスターとしてアサインする事が出来ると思いましたが解釈が間違っている<br>&gt; のでしょうか? アドバイスお願いします。<br>&gt;<br>
&gt; ---------- 転送メッセージ ----------<br>&gt; From: Tatsuo Ishii &lt;<a href="mailto:ishii@sraoss.co.jp" target="_blank">ishii@sraoss.co.jp</a>&gt;<br>&gt; 日付: 2010年10月18日6:47<br>&gt; 件名: Re: [pgpool-general-jp: 830] オンラインリカバリー<br>
&gt; To: <a href="mailto:pgpool-general-jp@sraoss.jp" target="_blank">pgpool-general-jp@sraoss.jp</a>, <a href="mailto:revivex36@gmail.com" target="_blank">revivex36@gmail.com</a><br>&gt;<br>&gt;<br>&gt;  &gt; 1、マスターになるDBが停止している場合にはリカバリーはできない。<br>
&gt;&gt; 2、したがって、マスターのDBに障害が発生した場合には、PGPOOLの設定を変更して<br>&gt;&gt; 別のノードをマスターにアサインしたうえでリカバリーを行う。<br>&gt;&gt;<br>&gt;&gt; こんな感じですか?<br>&gt;<br>&gt; どういうモードでpgpool-IIを動かしている場合の話ですか?<br>&gt; --<br>&gt; Tatsuo Ishii<br>&gt; SRA OSS, Inc. Japan<br>
&gt; English: <a href="http://www.sraoss.co.jp/index_en.php" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>&gt; Japanese: <a href="http://www.sraoss.co.jp/" target="_blank">http://www.sraoss.co.jp</a><br></div>
</div></div></div></div><br></div><br>