<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><span class="">&gt; such messages (for now). But, anyway, DNS names in ringX_addr seem not<br>
&gt; working, and no relevant messages are in default logs. Maybe add some<br>
&gt; validations for ringX_addr?<br>
&gt;<br>
&gt; I&#39;m having resolvable DNS names:<br>
&gt;<br>
&gt; root@node1:/etc/corosync# ping -c1 -W100 node1 | grep from<br>
&gt; 64 bytes from node1 (127.0.1.1): icmp_seq=1 ttl=64 time=0.039 ms<br>
&gt;<br>
<br>
</span>This is problem. Resolving node1 to localhost (127.0.0.1) is simply<br>
wrong. Names you want to use in corosync.conf should resolve to<br>
interface address. I believe other nodes has similar setting (so node2<br>
resolved on node2 is again 127.0.0.1)<br></blockquote><div><br></div><div>Wow! What a shame! How could I miss it... So you&#39;re absolutely right, thanks: that was the cause, an entry in /etc/hosts. On some machines I removed it manually, but on others - didn&#39;t. Now I do it automatically by sed -i -r &quot;/^.*[[:space:]]$host([[:space:]]|\$)/d&quot; /etc/hosts in the initialization script.</div><div><br></div><div>I apologize for the mess.</div><div><br></div><div>So now I have only one place in corosync.conf where I need to specify a plain IP address for UDPu: totem.interface.bindnetaddr. If I specify 0.0.0.0 there, I&#39;m having a message &quot;Service engine &#39;corosync_quorum&#39; failed to load for reason &#39;configuration error: nodelist or quorum.expected_votes must be configured!&#39;&quot; in the logs (BTW it does not say that I mistaked in bindnetaddr). Is there a way to completely untie from IP addresses?</div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Please try to fix this problem first and let&#39;s see if this will solve<br>
issue you are hitting.<br>
<br>
Regards,<br>
  Honza<br>
<div><div class="h5"><br>
&gt; root@node1:/etc/corosync# ping -c1 -W100 node2 | grep from<br>
&gt; 64 bytes from node2 (188.166.54.190): icmp_seq=1 ttl=55 time=88.3 ms<br>
&gt;<br>
&gt; root@node1:/etc/corosync# ping -c1 -W100 node3 | grep from<br>
&gt; 64 bytes from node3 (128.199.116.218): icmp_seq=1 ttl=51 time=252 ms<br>
&gt;<br>
&gt;<br>
&gt; With corosync.conf below, nothing works:<br>
&gt; ...<br>
&gt; nodelist {<br>
&gt;   node {<br>
&gt;     ring0_addr: node1<br>
&gt;   }<br>
&gt;   node {<br>
&gt;     ring0_addr: node2<br>
&gt;   }<br>
&gt;   node {<br>
&gt;     ring0_addr: node3<br>
&gt;   }<br>
&gt; }<br>
&gt; ...<br>
&gt; Jan 14 10:47:44 node1 corosync[15061]:  [MAIN  ] Corosync Cluster Engine<br>
&gt; (&#39;2.3.3&#39;): started and ready to provide service.<br>
&gt; Jan 14 10:47:44 node1 corosync[15061]:  [MAIN  ] Corosync built-in<br>
&gt; features: dbus testagents rdma watchdog augeas pie relro bindnow<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [TOTEM ] Initializing transport<br>
&gt; (UDP/IP Unicast).<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [TOTEM ] Initializing<br>
&gt; transmit/receive security (NSS) crypto: aes256 hash: sha1<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [TOTEM ] The network interface<br>
&gt; [a.b.c.d] is now up.<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine loaded:<br>
&gt; corosync configuration map access [0]<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [QB    ] server name: cmap<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine loaded:<br>
&gt; corosync configuration service [1]<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [QB    ] server name: cfg<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine loaded:<br>
&gt; corosync cluster closed process group service v1.01 [2]<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [QB    ] server name: cpg<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine loaded:<br>
&gt; corosync profile loading service [4]<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [WD    ] No Watchdog, try modprobe<br>
&gt; &lt;a watchdog&gt;<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [WD    ] no resources configured.<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine loaded:<br>
&gt; corosync watchdog service [7]<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [QUORUM] Using quorum provider<br>
&gt; corosync_votequorum<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [QUORUM] Quorum provider:<br>
&gt; corosync_votequorum failed to initialize.<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [SERV  ] Service engine<br>
&gt; &#39;corosync_quorum&#39; failed to load for reason &#39;configuration error: nodelist<br>
&gt; or quorum.expected_votes must be configured!&#39;<br>
&gt; Jan 14 10:47:44 node1 corosync[15062]:  [MAIN  ] Corosync Cluster Engine<br>
&gt; exiting with status 20 at service.c:356.<br>
&gt;<br>
&gt;<br>
&gt; But with IP addresses specified in ringX_addr, everything works:<br>
&gt; ...<br>
&gt; nodelist {<br>
&gt;   node {<br>
&gt;     ring0_addr: 104.236.71.79<br>
&gt;   }<br>
&gt;   node {<br>
&gt;     ring0_addr: 188.166.54.190<br>
&gt;   }<br>
&gt;   node {<br>
&gt;     ring0_addr: 128.199.116.218<br>
&gt;   }<br>
&gt; }<br>
&gt; ...<br>
&gt; Jan 14 10:48:28 node1 corosync[15155]:  [MAIN  ] Corosync Cluster Engine<br>
&gt; (&#39;2.3.3&#39;): started and ready to provide service.<br>
&gt; Jan 14 10:48:28 node1 corosync[15155]:  [MAIN  ] Corosync built-in<br>
&gt; features: dbus testagents rdma watchdog augeas pie relro bindnow<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] Initializing transport<br>
&gt; (UDP/IP Unicast).<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] Initializing<br>
&gt; transmit/receive security (NSS) crypto: aes256 hash: sha1<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] The network interface<br>
&gt; [a.b.c.d] is now up.<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync configuration map access [0]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QB    ] server name: cmap<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync configuration service [1]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QB    ] server name: cfg<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync cluster closed process group service v1.01 [2]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QB    ] server name: cpg<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync profile loading service [4]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [WD    ] No Watchdog, try modprobe<br>
&gt; &lt;a watchdog&gt;<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [WD    ] no resources configured.<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync watchdog service [7]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QUORUM] Using quorum provider<br>
&gt; corosync_votequorum<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync vote quorum service v1.0 [5]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QB    ] server name: votequorum<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [SERV  ] Service engine loaded:<br>
&gt; corosync cluster quorum service v0.1 [3]<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QB    ] server name: quorum<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] adding new UDPU member<br>
&gt; {a.b.c.d}<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] adding new UDPU member<br>
&gt; {e.f.g.h}<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] adding new UDPU member<br>
&gt; {i.j.k.l}<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [TOTEM ] A new membership<br>
&gt; (m.n.o.p:80) was formed. Members joined: 1760315215<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [QUORUM] Members[1]: 1760315215<br>
&gt; Jan 14 10:48:28 node1 corosync[15156]:  [MAIN  ] Completed service<br>
&gt; synchronization, ready to provide service.<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Jan 5, 2015 at 6:45 PM, Jan Friesse &lt;<a href="mailto:jfriesse@redhat.com">jfriesse@redhat.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; Dmitry,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;&gt; Sure, in logs I see &quot;adding new UDPU member {IP_ADDRESS}&quot; (so DNS names<br>
&gt;&gt;&gt; are definitely resolved), but in practice the cluster does not work, as I<br>
&gt;&gt;&gt; said above. So validations of ringX_addr in corosync.conf would be very<br>
&gt;&gt;&gt; helpful in corosync.<br>
&gt;&gt;<br>
&gt;&gt; that&#39;s weird. Because as long as DNS is resolved, corosync works only<br>
&gt;&gt; with IP. This means, code path is exactly same with IP or with DNS. Do<br>
&gt;&gt; you have logs from corosync?<br>
&gt;&gt;<br>
&gt;&gt; Honza<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; On Fri, Jan 2, 2015 at 2:49 PM, Jan Friesse &lt;<a href="mailto:jfriesse@redhat.com">jfriesse@redhat.com</a>&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Dmitry,<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;  No, I meant that if you pass a domain name in ring0_addr, there are no<br>
&gt;&gt;&gt;&gt;&gt; errors in logs, corosync even seems to find nodes (based on its logs),<br>
&gt;&gt; And<br>
&gt;&gt;&gt;&gt;&gt; crm_node -l shows them, but in practice nothing really works. A verbose<br>
&gt;&gt;&gt;&gt;&gt; error message would be very helpful in such case.<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; This sounds weird. Are you sure that DNS names really maps to correct IP<br>
&gt;&gt;&gt;&gt; address? In logs there should be something like &quot;adding new UDPU member<br>
&gt;&gt;&gt;&gt; {IP_ADDRESS}&quot;.<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Regards,<br>
&gt;&gt;&gt;&gt;   Honza<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; On Tuesday, December 30, 2014, Daniel Dehennin &lt;<br>
&gt;&gt;&gt;&gt;&gt; <a href="mailto:daniel.dehennin@baby-gnu.org">daniel.dehennin@baby-gnu.org</a>&gt;<br>
&gt;&gt;&gt;&gt;&gt; wrote:<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;  Dmitry Koterov &lt;<a href="mailto:dmitry.koterov@gmail.com">dmitry.koterov@gmail.com</a> &lt;javascript:;&gt;&gt; writes:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;  Oh, seems I&#39;ve found the solution! At least two mistakes was in my<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; corosync.conf (BTW logs did not say about any errors, so my<br>
&gt;&gt; conclusion<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; is<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; based on my experiments only).<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; 1. nodelist.node MUST contain only IP addresses. No hostnames! They<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; simply<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; do not work, &quot;crm status&quot; shows no nodes. And no warnings are in logs<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt; regarding this.<br>
&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; You can add name like this:<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;      nodelist {<br>
&gt;&gt;&gt;&gt;&gt;&gt;        node {<br>
&gt;&gt;&gt;&gt;&gt;&gt;          ring0_addr: &lt;public-ip-address-of-the-first-machine&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;          name: node1<br>
&gt;&gt;&gt;&gt;&gt;&gt;        }<br>
&gt;&gt;&gt;&gt;&gt;&gt;        node {<br>
&gt;&gt;&gt;&gt;&gt;&gt;          ring0_addr: &lt;public-ip-address-of-the-second-machine&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;          name: node2<br>
&gt;&gt;&gt;&gt;&gt;&gt;        }<br>
&gt;&gt;&gt;&gt;&gt;&gt;      }<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; I used it on Ubuntu Trusty with udpu.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; Regards.<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt; --<br>
&gt;&gt;&gt;&gt;&gt;&gt; Daniel Dehennin<br>
&gt;&gt;&gt;&gt;&gt;&gt; Récupérer ma clef GPG: gpg --recv-keys 0xCC1E9E5B7A6FE2DF<br>
&gt;&gt;&gt;&gt;&gt;&gt; Fingerprint: 3E69 014E 5C23 50E8 9ED6  2AAD CC1E 9E5B 7A6F E2DF<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt; Getting started:<br>
&gt;&gt; <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt; Getting started:<br>
&gt;&gt; <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt;&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;<br>
&gt;&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt;&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt;&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
<br>
_______________________________________________<br>
</div></div>discuss mailing list<br>
<a href="mailto:discuss@corosync.org">discuss@corosync.org</a><br>
<a href="http://lists.corosync.org/mailman/listinfo/discuss" target="_blank">http://lists.corosync.org/mailman/listinfo/discuss</a><br>
</blockquote></div><br></div></div>