<div dir="ltr"><div><div>Hi, Andrew:<br></div>If I cut down the network connection of the running 
node by:<br>service network stop, <br>&quot;crm status&quot; will show me the node is put into &quot;OFFLINE&quot; status. 
The affected resource can also be failed over to another online node 
correctly. But the issue is that, when I re-connect the network  by:<br>service network start.<br>to put 
the &quot;OFFLINE&quot; node to be &quot;Online&quot; again, all the resource is firstly 
stopped , then some resource are restarted again on the original online 
node and some other resource are going back to the newly &quot;Online&quot; node. 
This behavior seems not related to the resource-stickiness 
configuration.<br>
</div><div>I&#39;m just curious if it&#39;s the default behavior.<br></div><div>And if I tried to reboot the OFFLINE node, when it&#39;s online again, the resource won&#39;t be stopped.<br></div><div>Is this expected that &quot;service network start&quot; triggers Pacemaker to reassign resource?<br>
</div>Thanks.<div class=""><div id=":2p" class="" tabindex="0"><img class="" src="https://mail.google.com/mail/u/0/images/cleardot.gif"></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Jun 14, 2013 at 10:06 AM, Andrew Beekhof <span dir="ltr">&lt;<a href="mailto:andrew@beekhof.net" target="_blank">andrew@beekhof.net</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><br>
On 13/06/2013, at 5:15 PM, Xiaomin Zhang &lt;<a href="mailto:zhangxiaomin@gmail.com">zhangxiaomin@gmail.com</a>&gt; wrote:<br>
<br>
&gt; Thanks Andrew.<br>
&gt; Yes, the fs_ssn service (ocf:FileSystem) is still running when the machine loses network. I configure it as primitive:<br>
&gt; primitive fs_ssn ocf:heartbeat:Filesystem \<br>
&gt;      op monitor interval=&quot;15s&quot; \<br>
&gt;      params device=&quot;/dev/drbd0&quot; directory=&quot;/drbd&quot; fstype=&quot;ext3&quot; \<br>
&gt;      meta target-role=&quot;Started&quot;<br>
&gt; As I assume this resource can only be started on 1 node, I think it should be stopped automatically when pacemaker detects it&#39;s not in a HA cluster.<br>
&gt; Is this incorrect assumption?<br>
<br>
</div>No. But I&#39;d need to see logs from all the nodes (please use attachments) to be able to comment further.<br>
<div class="HOEnZb"><div class="h5"><br>
&gt; Thanks.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Thu, Jun 13, 2013 at 1:50 PM, Andrew Beekhof &lt;<a href="mailto:andrew@beekhof.net">andrew@beekhof.net</a>&gt; wrote:<br>
&gt;<br>
&gt; On 13/06/2013, at 2:43 PM, Xiaomin Zhang &lt;<a href="mailto:zhangxiaomin@gmail.com">zhangxiaomin@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; Andrew Beekhof &lt;andrew@...&gt; writes:<br>
&gt; &gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Try increasing your stickiness as it is being exceeded by the location<br>
&gt; &gt; constraints.<br>
&gt; &gt;&gt; For the biggest stick, try &#39;infinity&#39; which means - never move unless the<br>
&gt; &gt; node dies.<br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
&gt; &gt; Thanks, Andrew, I applied infinity resource stickiness. However, the sst<br>
&gt; &gt; resource is still switched to the node which is online back from failure.<br>
&gt; &gt; And I found sth in the log:<br>
&gt; &gt;<br>
&gt; &gt; Jun 13 11:46:29 node3 pengine[27813]:  warning: unpack_rsc_op: Processing<br>
&gt; &gt; failed op monitor for ip_ssn on node2: not running (7)<br>
&gt; &gt; Jun 13 11:46:29 node3 pengine[27813]:    error: native_create_actions:<br>
&gt; &gt; Resource fs_ssn (ocf::Filesystem) is active on 2 nodes attempting recovery<br>
&gt; &gt; Jun 13 11:46:29 node3 pengine[27813]:  warning: native_create_actions: See<br>
&gt; &gt; <a href="http://clusterlabs.org/wiki/FAQ#Resource_is_Too_Active" target="_blank">http://clusterlabs.org/wiki/FAQ#Resource_is_Too_Active</a> for more information.<br>
&gt; &gt;<br>
&gt; &gt; Is this log showing that pacemaker tries to restart all the resource when<br>
&gt; &gt; the failed node is back again?<br>
&gt;<br>
&gt; No, thats a log showing the services were already running there when pacemaker started.<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;&gt;&gt; Thanks.<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Below is my configure:<br>
&gt; &gt;&gt;&gt; ------------------CONFIG START--------------------------------------<br>
&gt; &gt;&gt;&gt; node node3 \<br>
&gt; &gt;&gt;&gt;     attributes standby=&quot;on&quot;<br>
&gt; &gt;&gt;&gt; node node1<br>
&gt; &gt;&gt;&gt; node node2<br>
&gt; &gt;&gt;&gt; primitive drbd_ssn ocf:linbit:drbd \<br>
&gt; &gt;&gt;&gt;     params drbd_resource=&quot;r0&quot; \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot;<br>
&gt; &gt;&gt;&gt; primitive fs_ssn ocf:heartbeat:Filesystem \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot; \<br>
&gt; &gt;&gt;&gt;     params device=&quot;/dev/drbd0&quot; directory=&quot;/drbd&quot; fstype=&quot;ext3&quot; \<br>
&gt; &gt;&gt;&gt;     meta target-role=&quot;Started&quot;<br>
&gt; &gt;&gt;&gt; primitive ip_ssn ocf:heartbeat:IPaddr2 \<br>
&gt; &gt;&gt;&gt;     params ip=&quot;192.168.241.1&quot; cidr_netmask=&quot;32&quot; \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot; \<br>
&gt; &gt;&gt;&gt;     meta target-role=&quot;Started&quot;<br>
&gt; &gt;&gt;&gt; primitive ip_sst ocf:heartbeat:IPaddr2 \<br>
&gt; &gt;&gt;&gt;     params ip=&quot;192.168.241.2&quot; cidr_netmask=&quot;32&quot; \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot; \<br>
&gt; &gt;&gt;&gt;     meta target-role=&quot;Started&quot;<br>
&gt; &gt;&gt;&gt; primitive sst lsb:sst \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot; \<br>
&gt; &gt;&gt;&gt;     meta target-role=&quot;stopped&quot;<br>
&gt; &gt;&gt;&gt; primitive ssn lsb:ssn \<br>
&gt; &gt;&gt;&gt;     op monitor interval=&quot;15s&quot; \<br>
&gt; &gt;&gt;&gt;     meta target-role=&quot;stopped&quot;<br>
&gt; &gt;&gt;&gt; ms ms_drbd_ssn drbd_ssn \<br>
&gt; &gt;&gt;&gt;     meta master-max=&quot;1&quot; master-node-max=&quot;1&quot; clone-max=&quot;2&quot; clone-node-max=&quot;1&quot;<br>
&gt; &gt;&gt;&gt; notify=&quot;true&quot; target-role=&quot;Started&quot;<br>
&gt; &gt;&gt;&gt; location sst_ip_prefer ip_sst 50: node1<br>
&gt; &gt;&gt;&gt; location drbd_ssn_prefer ms_drbd_ssn 50: node1<br>
&gt; &gt;&gt;&gt; colocation fs_ssn_coloc inf: ip_ssn fs_ssn<br>
&gt; &gt;&gt;&gt; colocation fs_on_drbd_coloc inf: fs_ssn ms_drbd_ssn:Master<br>
&gt; &gt;&gt;&gt; colocation sst_ip_coloc inf: sst ip_sst<br>
&gt; &gt;&gt;&gt; colocation ssn_ip_coloc inf: ssn ip_ssn<br>
&gt; &gt;&gt;&gt; order ssn_after_drbd inf: ms_drbd_ssn:promote fs_ssn:start<br>
&gt; &gt;&gt;&gt; order ip_after_fs inf: fs_ssn:start ip_ssn:start<br>
&gt; &gt;&gt;&gt; order sst_after_ip inf: ip_sst:start sst:start<br>
&gt; &gt;&gt;&gt; order sst_after_ssn inf: ssn:start sst:start<br>
&gt; &gt;&gt;&gt; order ssn_after_ip inf: ip_ssn:start ssn:start<br>
&gt; &gt;&gt;&gt; property $id=&quot;cib-bootstrap-options&quot; \<br>
&gt; &gt;&gt;&gt;     dc-version=&quot;1.1.8-7.el6-394e906&quot; \<br>
&gt; &gt;&gt;&gt;     cluster-infrastructure=&quot;classic openais (with plugin)&quot; \<br>
&gt; &gt;&gt;&gt;     expected-quorum-votes=&quot;3&quot; \<br>
&gt; &gt;&gt;&gt;     stonith-enabled=&quot;false&quot;<br>
&gt; &gt;&gt;&gt; rsc_defaults $id=&quot;rsc-options&quot; \<br>
&gt; &gt;&gt;&gt;     resource-stickiness=&quot;100&quot;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; -------------------CONFIG END----------------------------------------<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt; Best Regards.<br>
&gt; &gt; Xiaomin<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt; &gt;<br>
&gt; &gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; &gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; &gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br></div>