<div dir="ltr"><span style="color:rgb(0,0,0);font-family:sans-serif;font-size:13px;line-height:19px">In streaming master/slave we testing all online nodes in function </span>check_replication_time_lag. <br><div><br></div><div>
I add new feature. I test all nodes include dead nodes. </div><div><br></div><div>If down slave node now alive, i compare time_lag with master. And try this few times (new param in config sr_check_max_retries) If slave node not far behind, i mark node as NODE_UP.</div>
<div><br></div><div>If mater node now is online, i check time_lag on all slave nodes. And if lag=0, i think this master is working fine, and reattach it.<br></div><div><br></div><div>This will solved the problem ticket #17<br>
</div><div>My implementation see in diff file.<br></div><div><br></div><div><br></div></div>