<html><body><div style="color:#000; background-color:#fff; font-family:verdana, helvetica, sans-serif;font-size:12pt"><div><font size="2"><span>Hi,</span></font></div><div><font size="2"><br><span></span></font></div><div><font size="2"><span>I've tried moving the corosync startup from S20 to S98 but the issue is still there.</span></font></div><div><font size="2"><br><span></span></font></div><div><span><font size="2">Maybe I'll have to remove it from init and write an upstart for corosync.</font></span></div><div><br></div><div style="font-family: verdana,helvetica,sans-serif; font-size: 12pt;"><div style="font-family: times new roman,new york,times,serif; font-size: 12pt;"><font face="Arial" size="2"><hr size="1"><b><span style="font-weight: bold;">From:</span></b> Andreas Kurz &lt;andreas@hastexo.com&gt;<br><b><span style="font-weight: bold;">To:</span></b> pacemaker@oss.clusterlabs.org<br><b><span style="font-weight: bold;">Sent:</span></b> Tuesday,
 25 October 2011 6:50 PM<br><b><span style="font-weight: bold;">Subject:</span></b> Re: [Pacemaker] Cluster goes to (unmanaged) Failed state when both nodes are rebooted together<br></font><br>hello,<br><br>On 10/25/2011 09:17 AM, ihjaz Mohamed wrote:<br>&gt; If I start the corosync together on both the servers, it comes up good.<br>&gt; So am just wondering how is this different from corosync being started<br>&gt; by the server during boot up.<br><br>maybe corosync ist started to early on system boot when network<br>connectivity is not fully established.<br><br>Regards,<br>Andreas<br><br>-- <br>Need help with Pacemaker?<br><a href="http://www.hastexo.com/now" target="_blank">http://www.hastexo.com/now</a><br><br>&gt; <br>&gt; <br>&gt; ------------------------------------------------------------------------<br>&gt; *From:* Andreas Kurz &lt;<a ymailto="mailto:andreas@hastexo.com" href="mailto:andreas@hastexo.com">andreas@hastexo.com</a>&gt;<br>&gt; *To:*
 <a ymailto="mailto:pacemaker@oss.clusterlabs.org" href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a><br>&gt; *Sent:* Monday, 24 October 2011 9:30 PM<br>&gt; *Subject:* Re: [Pacemaker] Cluster goes to (unmanaged) Failed state when<br>&gt; both nodes are rebooted together<br>&gt; <br>&gt; hello,<br>&gt; <br>&gt; On 10/24/2011 05:21 PM, ihjaz Mohamed wrote:<br>&gt;&gt; Its part of the requirement given to me to support this solution on<br>&gt;&gt; servers without stonith devices. So I cannot enable the stonith.<br>&gt; <br>&gt; Too bad, than you have to live with some limitations of this setup. You<br>&gt; could add some random wait to/before corosync start ... or simply: don't<br>&gt; reboot them at the same time ;-)<br>&gt; <br>&gt; But it would also be interesting why FloatingIP_stop_0 returns an error<br>&gt; on both nodes ... logs should tell you what happened.<br>&gt; <br>&gt; .... and remove nic="eth0:0", you must not
 define any alias here but<br>&gt; only the nic itself.<br>&gt; <br>&gt; Regards,<br>&gt; Andreas<br>&gt; <br>&gt; -- <br>&gt; Need help with Pacemaker?<br>&gt; <a href="http://www.hastexo.com/now" target="_blank">http://www.hastexo.com/now</a><br>&gt; <br>&gt; <br>&gt;&gt;<br>&gt;&gt; ------------------------------------------------------------------------<br>&gt;&gt; *From:* Alan Robertson &lt;<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a> &lt;mailto:<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a>&gt;&gt;<br>&gt;&gt; *To:* ihjaz Mohamed &lt;<a ymailto="mailto:ihjazmohamed@yahoo.co.in" href="mailto:ihjazmohamed@yahoo.co.in">ihjazmohamed@yahoo.co.in</a><br>&gt; &lt;mailto:<a ymailto="mailto:ihjazmohamed@yahoo.co.in" href="mailto:ihjazmohamed@yahoo.co.in">ihjazmohamed@yahoo.co.in</a>&gt;&gt;; The Pacemaker clusterFloatingIP_stop_0<br>&gt;&gt; resource manager &lt;<a
 ymailto="mailto:pacemaker@oss.clusterlabs.org" href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a><br>&gt; &lt;mailto:<a ymailto="mailto:pacemaker@oss.clusterlabs.org" href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a>&gt;&gt;<br>&gt;&gt; *Sent:* Monday, 24 October 2011 8:22 PM<br>&gt;&gt; *Subject:* Re: [Pacemaker] Cluster goes to (unmanaged) Failed state when<br>&gt;&gt; both nodes are rebooted together<br>&gt;&gt;<br>&gt;&gt; Setting no-quorum-policy to ignore and disabling stonith is not a good<br>&gt;&gt; idea.&nbsp; You're sort of inviting the cluster to do screwed up things.<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; On 10/24/2011 08:23 AM, ihjaz Mohamed wrote:<br>&gt;&gt;&gt; Hi All,<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; I 've pacemaker running with corosync. Following is my CRM configuration.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; node soalaba56<br>&gt;&gt;&gt; node soalaba63<br>&gt;&gt;&gt; primitive FloatingIP
 ocf:heartbeat:IPaddr2 \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; params ip="&lt;floating_ip&gt;" nic="eth0:0"<br>&gt;&gt;&gt; primitive acestatus lsb:acestatus \<br>&gt;&gt;&gt; primitive pingd ocf:pacemaker:ping \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; params host_list="&lt;gateway_ip&gt;" multiplier="100" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; op monitor interval="15s" timeout="5s"<br>&gt;&gt;&gt; group HAService FloatingIP acestatus \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; meta target-role="Started"<br>&gt;&gt;&gt; clone pingdclone pingd \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; meta globally-unique="false"<br>&gt;&gt;&gt; location ip1_location FloatingIP \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; rule $id="ip1_location-rule" pingd: defined pingd<br>&gt;&gt;&gt; property $id="cib-bootstrap-options" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp;  <br>&gt;&gt;&gt; dc-version="1.1.5-5.el6-01e86afaaa6d4a8c4836f68df80ababd6ca3902f"
 \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; cluster-infrastructure="openais" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; expected-quorum-votes="2" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; stonith-enabled="false" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; no-quorum-policy="ignore" \<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; &nbsp; last-lrm-refresh="1305736421"<br>&gt;&gt;&gt; ----------------------------------------------------------------------<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; When I reboot both the nodes together, cluster goes into an<br>&gt;&gt;&gt; (unmanaged) Failed state as shown below.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; ============<br>&gt;&gt;&gt; Last updated: Mon Oct 24 08:10:42 2011<br>&gt;&gt;&gt; Stack: openais<br>&gt;&gt;&gt; Current DC: soalaba63 - partition with quorum<br>&gt;&gt;&gt; Version: 1.1.5-5.el6-01e86afaaa6d4a8c4836f68df80ababd6ca3902f<br>&gt;&gt;&gt; 2 Nodes configured, 2 expected votes<br>&gt;&gt;&gt; 2 Resources
 configured.<br>&gt;&gt;&gt; ============<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Online: [ soalaba56 soalaba63 ]<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;&nbsp; Resource Group: HAService<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; FloatingIP (ocf::heartbeat:IPaddr2) Started&nbsp; (unmanaged)<br>&gt;&gt;&gt; FAILED[&nbsp; soalaba63&nbsp; &nbsp; &nbsp; soalaba56 ]<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; acestatus&nbsp; (lsb:acestatus):&nbsp; &nbsp; &nbsp; &nbsp; Stopped<br>&gt;&gt;&gt;&nbsp; Clone Set: pingdclone [pingd]<br>&gt;&gt;&gt;&nbsp; &nbsp; &nbsp; Started: [ soalaba56 soalaba63 ]<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Failed actions:<br>&gt;&gt;&gt;&nbsp; &nbsp; FloatingIP_stop_0 (node=soalaba63, call=7, rc=1, status=complete):<br>&gt;&gt;&gt; unknown error<br>&gt;&gt;&gt;&nbsp; &nbsp; FloatingIP_stop_0 (node=soalaba56, call=7, rc=1, status=complete):<br>&gt;&gt;&gt; unknown error<br>&gt;&gt;&gt;<br>&gt;
 ------------------------------------------------------------------------------<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; This happens only when the reboot is done simultaneously on both the<br>&gt;&gt;&gt; nodes. If reboot is done with some interval in between this is not<br>&gt;&gt;&gt; seen. Looking into the logs I see that&nbsp; when the nodes come up<br>&gt;&gt;&gt; resources are started on both the nodes and then it tries to stop the<br>&gt;&gt;&gt; started resources and fails there.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; I've attached the logs.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt; Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; &lt;mailto:<a ymailto="mailto:Pacemaker@oss.clusterlabs.org"
 href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a>&gt;<br>&gt; &lt;mailto:<a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; &lt;mailto:<a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a>&gt;&gt;<br>&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>&gt;&gt;&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>&gt;&gt;&gt; Bugs:<br>&gt; <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker"
 target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; --<br>&gt;&gt;&nbsp; &nbsp; Alan Robertson &lt;<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a> &lt;mailto:<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a>&gt;&gt;<br>&gt; &lt;mailto:<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a> &lt;mailto:<a ymailto="mailto:alanr@unix.sh" href="mailto:alanr@unix.sh">alanr@unix.sh</a>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; "Openness is the foundation and preservative of friendship...&nbsp; Let me<br>&gt; claim from you at all times your undisguised opinions." - William<br>&gt; Wilberforce<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; _______________________________________________<br>&gt;&gt; Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org"
 href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; &lt;mailto:<a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a>&gt;<br>&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>&gt;&gt;<br>&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>&gt;&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>&gt;&gt; Bugs:<br>&gt; <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>&gt; <br>&gt; <br>&gt; <br>&gt; _______________________________________________<br>&gt;
 Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; &lt;mailto:<a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a>&gt;<br>&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>&gt; <br>&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>&gt; Bugs:<br>&gt; <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>&gt; <br>&gt; <br>&gt; <br>&gt;
 <br>&gt; _______________________________________________<br>&gt; Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>&gt; <br>&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>&gt; Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br><br><br><br><br><br>_______________________________________________<br>Pacemaker mailing list: <a
 ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br><a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br><br>Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br><br><br></div></div></div></body></html>