[pgpool-general-jp: 508] Re: オンラインリカバリ pcp_recovery_node BackendError

篠田 剛毅 ty-shinoda @ ultra-soccer.co.jp
2008年 11月 12日 (水) 18:27:32 JST


篠田です。
度々お世話になります。

> 2点確認なのですが、以下はどうなっているでしょうか?
> 1.backend_data_directoryX」は各DBノード毎に問題なく設定されているか。
> 2.各DBノード間で、パスフレーズ無しでSSH接続できるように設定されているか。
はい。今回の構成はDBノードが4基ありますので、
backend_data_directoryXは4個設定してあります。
また各ノード間でもパスフレーズ無しで接続出来ている状況です。


> 上記の2点が問題無く、最初に実行されるべき1stスクリプトが実行されないとなると、下記を疑うべきかもしれません。
> 
> 1.各DBノードの$PGDATA内にリカバリスクリプトが全て揃っているのか。
> 2.各リカバリスクリプトのオーナーとグループ、及びパーミッションはpgpool.confに指定されているrecovery_userが実行できる権限になっているか

ここに関してですが、
$PGDATA内にリカバリスクリプトは揃っております。
ただ、2の実行権限に関しては、記述ミスを発見し記載を変えたところ
1stステージの最初の入り口だけではありますが、
動き始めた模様です。

そのログが下記になります。

2008-11-12 18:23:42 LOG:   pid 25906: starting recovering node 1
2008-11-12 18:23:42 LOG:   pid 25906: CHECKPOINT in the 1st stage done
2008-11-12 18:23:42 LOG:   pid 25906: starting recovery command: "SELECT pgpool_recovery('pgpool_copy_backup',ホスト名, $PGDATA)"
2008-11-12 18:23:42 ERROR: pid 25906: exec_recovery: pgpool_copy_backup command failed at 1st stage
※一部加工しました。


このログにあるのから推測すると、
XXX.XXX.XXX.XXX:$PGDATA/pgpool_copy_backup
というスクリプトを実行してるがエラーを起こしてるようですので、
スクリプト自体の見直しをしてみます。


pgpool-general-jp メーリングリストの案内