<div dir="ltr">Got it. Thank you =)<div>I just thought about possibility of a NIC to burn down. </div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr">Thank you,<div>Kostya</div></div></div></div>
<br><div class="gmail_quote">On Tue, Jan 20, 2015 at 10:50 AM, Jan Friesse <span dir="ltr">&lt;<a href="mailto:jfriesse@redhat.com" target="_blank">jfriesse@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Kostiantyn,<br>
<span class=""><br>
<br>
&gt; One more thing to clarify.<br>
&gt; You said &quot;rebind can be avoided&quot; - what does it mean?<br>
<br>
</span>By that I mean that as long as you don&#39;t shutdown interface everything<br>
will work as expected. Interface shutdown is administrator decision,<br>
system doesn&#39;t do it automagically :)<br>
<div class="HOEnZb"><div class="h5"><br>
Regards,<br>
  Honza<br>
<br>
&gt;<br>
&gt; Thank you,<br>
&gt; Kostya<br>
&gt;<br>
&gt; On Wed, Jan 14, 2015 at 1:31 PM, Kostiantyn Ponomarenko &lt;<br>
&gt; <a href="mailto:konstantin.ponomarenko@gmail.com">konstantin.ponomarenko@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; Thank you. Now I am aware of it.<br>
&gt;&gt;<br>
&gt;&gt; Thank you,<br>
&gt;&gt; Kostya<br>
&gt;&gt;<br>
&gt;&gt; On Wed, Jan 14, 2015 at 12:59 PM, Jan Friesse &lt;<a href="mailto:jfriesse@redhat.com">jfriesse@redhat.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt;&gt; Kostiantyn,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Honza,<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Thank you for helping me.<br>
&gt;&gt;&gt;&gt; So, there is no defined behavior in case one of the interfaces is not in<br>
&gt;&gt;&gt;&gt; the system?<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; You are right. There is no defined behavior.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Regards,<br>
&gt;&gt;&gt;   Honza<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Thank you,<br>
&gt;&gt;&gt;&gt; Kostya<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; On Tue, Jan 13, 2015 at 12:01 PM, Jan Friesse &lt;<a href="mailto:jfriesse@redhat.com">jfriesse@redhat.com</a>&gt;<br>
&gt;&gt;&gt; wrote:<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; Kostiantyn,<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; According to the <a href="https://access.redhat.com/solutions/638843" target="_blank">https://access.redhat.com/solutions/638843</a> , the<br>
&gt;&gt;&gt;&gt;&gt;&gt; interface, that is defined in the corosync.conf, must be present in<br>
&gt;&gt;&gt; the<br>
&gt;&gt;&gt;&gt;&gt;&gt; system (see at the bottom of the article, section &quot;ROOT CAUSE&quot;).<br>
&gt;&gt;&gt;&gt;&gt;&gt; To confirm that I made a couple of tests.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Here is a part of the corosync.conf file (in a free-write form) (also<br>
&gt;&gt;&gt;&gt;&gt;&gt; attached the origin config file):<br>
&gt;&gt;&gt;&gt;&gt;&gt; ===============================<br>
&gt;&gt;&gt;&gt;&gt;&gt; rrp_mode: passive<br>
&gt;&gt;&gt;&gt;&gt;&gt; ring0_addr is defined in corosync.conf<br>
&gt;&gt;&gt;&gt;&gt;&gt; ring1_addr is defined in corosync.conf<br>
&gt;&gt;&gt;&gt;&gt;&gt; ===============================<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Two-node cluster<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Test #1:<br>
&gt;&gt;&gt;&gt;&gt;&gt; --------------------------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt; IP for ring0 is not defines in the system:<br>
&gt;&gt;&gt;&gt;&gt;&gt; --------------------------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt; Start Corosync simultaneously on both nodes.<br>
&gt;&gt;&gt;&gt;&gt;&gt; Corosync fails to start.<br>
&gt;&gt;&gt;&gt;&gt;&gt; From the logs:<br>
&gt;&gt;&gt;&gt;&gt;&gt; Jan 08 09:43:56 [2992] A6-402-2 corosync error [MAIN ] parse error in<br>
&gt;&gt;&gt;&gt;&gt;&gt; config: No interfaces defined<br>
&gt;&gt;&gt;&gt;&gt;&gt; Jan 08 09:43:56 [2992] A6-402-2 corosync error [MAIN ] Corosync<br>
&gt;&gt;&gt; Cluster<br>
&gt;&gt;&gt;&gt;&gt;&gt; Engine exiting with status 8 at main.c:1343.<br>
&gt;&gt;&gt;&gt;&gt;&gt; Result: Corosync and Pacemaker are not running.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Test #2:<br>
&gt;&gt;&gt;&gt;&gt;&gt; --------------------------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt; IP for ring1 is not defines in the system:<br>
&gt;&gt;&gt;&gt;&gt;&gt; --------------------------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt; Start Corosync simultaneously on both nodes.<br>
&gt;&gt;&gt;&gt;&gt;&gt; Corosync starts.<br>
&gt;&gt;&gt;&gt;&gt;&gt; Start Pacemaker simultaneously on both nodes.<br>
&gt;&gt;&gt;&gt;&gt;&gt; Pacemaker fails to start.<br>
&gt;&gt;&gt;&gt;&gt;&gt; From the logs, the last writes from the &quot;corosync&quot;:<br>
&gt;&gt;&gt;&gt;&gt;&gt; Jan 8 16:31:29 daemon.err&lt;27&gt; corosync[3728]: [TOTEM ] Marking ringid<br>
&gt;&gt;&gt; 0<br>
&gt;&gt;&gt;&gt;&gt;&gt; interface 169.254.1.3 FAULTY<br>
&gt;&gt;&gt;&gt;&gt;&gt; Jan 8 16:31:30 daemon.notice&lt;29&gt; corosync[3728]: [TOTEM ]<br>
&gt;&gt;&gt; Automatically<br>
&gt;&gt;&gt;&gt;&gt;&gt; recovered ring 0<br>
&gt;&gt;&gt;&gt;&gt;&gt; Result: Corosync and Pacemaker are not running.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Test #3:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; &quot;rrp_mode: active&quot; leads to the same result, except Corosync and<br>
&gt;&gt;&gt;&gt;&gt; Pacemaker<br>
&gt;&gt;&gt;&gt;&gt;&gt; init scripts return status &quot;running&quot;.<br>
&gt;&gt;&gt;&gt;&gt;&gt; But still &quot;vim /var/log/cluster/corosync.log&quot; shows a lot of errors<br>
&gt;&gt;&gt; like:<br>
&gt;&gt;&gt;&gt;&gt;&gt; Jan 08 16:30:47 [4067] A6-402-1 cib: error: pcmk_cpg_dispatch:<br>
&gt;&gt;&gt; Connection<br>
&gt;&gt;&gt;&gt;&gt;&gt; to the CPG API failed: Library error (2)<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Result: Corosync and Pacemaker show their statuses as &quot;running&quot;, but<br>
&gt;&gt;&gt;&gt;&gt;&gt; &quot;crm_mon&quot; cannot connect to the cluster database. And half of the<br>
&gt;&gt;&gt;&gt;&gt;&gt; Pacemaker&#39;s services are not running (including Cluster Information<br>
&gt;&gt;&gt; Base<br>
&gt;&gt;&gt;&gt;&gt;&gt; (CIB)).<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; For a single node mode<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; IP for ring0 is not defines in the system:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Corosync fails to start.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; IP for ring1 is not defines in the system:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Corosync and Pacemaker are started.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; It is possible that configuration will be applied successfully (50%),<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; and it is possible that the cluster is not running any resources,<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; and it is possible that the node cannot be put in a standby mode<br>
&gt;&gt;&gt; (shows:<br>
&gt;&gt;&gt;&gt;&gt;&gt; communication error),<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; and it is possible that the cluster is running all resources, but<br>
&gt;&gt;&gt; applied<br>
&gt;&gt;&gt;&gt;&gt;&gt; configuration is not guaranteed to be fully loaded (some rules can be<br>
&gt;&gt;&gt;&gt;&gt;&gt; missed).<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Conclusions:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; -------------------------------<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; It is possible that in some rare cases (see comments to the bug) the<br>
&gt;&gt;&gt;&gt;&gt;&gt; cluster will work, but in that case its working state is unstable and<br>
&gt;&gt;&gt; the<br>
&gt;&gt;&gt;&gt;&gt;&gt; cluster can stop working every moment.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; So, is it correct? Does my assumptions make any sense? I didn&#39;t any<br>
&gt;&gt;&gt; other<br>
&gt;&gt;&gt;&gt;&gt;&gt; explanation in the network ... .<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; Corosync needs all interfaces during start and runtime. This doesn&#39;t<br>
&gt;&gt;&gt;&gt;&gt; mean they must be connected (this would make corosync unusable for<br>
&gt;&gt;&gt;&gt;&gt; physical NIC/Switch or cable failure), but they must be up and have<br>
&gt;&gt;&gt;&gt;&gt; correct ip.<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; When this is not the case, corosync rebinds to localhost and weird<br>
&gt;&gt;&gt;&gt;&gt; things happens. Removal of this rebinding is long time TODO, but there<br>
&gt;&gt;&gt;&gt;&gt; are still more important bugs (especially because rebind can be<br>
&gt;&gt;&gt; avoided).<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; Regards,<br>
&gt;&gt;&gt;&gt;&gt;   Honza<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Thank you,<br>
&gt;&gt;&gt;&gt;&gt;&gt; Kostya<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; On Fri, Jan 9, 2015 at 11:10 AM, Kostiantyn Ponomarenko &lt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; <a href="mailto:konstantin.ponomarenko@gmail.com">konstantin.ponomarenko@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Hi guys,<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Corosync fails to start if there is no such network interface<br>
&gt;&gt;&gt; configured<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; in the system.<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Even with &quot;rrp_mode: passive&quot; the problem is the same when at least<br>
&gt;&gt;&gt; one<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; network interface is not configured in the system.<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Is this the expected behavior?<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; I thought that when you use redundant rings, it is enough to have at<br>
&gt;&gt;&gt;&gt;&gt; least<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; one NIC configured in the system. Am I wrong?<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Thank you,<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; Kostya<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt;&gt; Getting started:<br>
&gt;&gt;&gt; <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt;&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt; Getting started:<br>
&gt;&gt;&gt; <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt; Getting started:<br>
&gt;&gt;&gt; <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br></div>