<br><br><div class="gmail_quote">On Mon, Oct 12, 2009 at 8:40 PM, Andrew Beekhof <span dir="ltr">&lt;<a href="mailto:andrew@beekhof.net">andrew@beekhof.net</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The crmd process looks to have stalled.<br>
Can you re-run with debug turned on in openais.conf?<br>
<div><div></div><div class="h5"><br>
On Mon, Oct 12, 2009 at 6:09 PM, Stratos Zolotas &lt;<a href="mailto:strzol@gmail.com">strzol@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Oct 12, 2009 at 5:57 PM, Dejan Muhamedagic &lt;<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi,<br>
&gt;&gt;<br>
&gt;&gt; On Mon, Oct 12, 2009 at 03:32:15PM +0300, Stratos Zolotas wrote:<br>
&gt;&gt; &gt; On Mon, Oct 12, 2009 at 3:10 PM, Dejan Muhamedagic<br>
&gt;&gt; &gt; &lt;<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a>&gt;wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; &gt; On Mon, Oct 12, 2009 at 02:57:29PM +0300, Stratos Zolotas wrote:<br>
&gt;&gt; &gt; &gt; &gt; On Mon, Oct 12, 2009 at 2:51 PM, Dejan Muhamedagic<br>
&gt;&gt; &gt; &gt; &gt; &lt;<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a><br>
&gt;&gt; &gt; &gt; &gt;wrote:<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; Hi,<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; On Mon, Oct 12, 2009 at 02:42:25PM +0300, Stratos Zolotas wrote:<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Hello to the list!!!<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; This is my first question to the list and my first attempt to<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; built a<br>
&gt;&gt; &gt; &gt; two<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; node cluster on opensuse 11.1 with pacemaker 1.0.5 and openais<br>
&gt;&gt; &gt; &gt; 0.80.5, so<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; please forgive my lack of knowledge.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; I&#39;m trying to build a Active/Passive scenario but i have the<br>
&gt;&gt; &gt; &gt; following on<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; both nodes:<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Oct 12 14:05:57 alpha kernel: crmd[30704]: segfault at 18 ip<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; 00007f7770526eee sp 00007fffc7379810 error 4 in<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; libplumb.so.2.0.0[7f777050a000+30000]<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; It&#39;d be excellent to see the backtrace, providing that there are<br>
&gt;&gt; &gt; &gt; &gt; &gt; core files. Please enable core file generation if there are none.<br>
&gt;&gt; &gt; &gt; &gt; &gt; If you don&#39;t know about backtraces, just use hb_report to capture<br>
&gt;&gt; &gt; &gt; &gt; &gt; it.<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; As result i&#39;m getting the following:<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; That&#39;s not the consequence of the previous problem.<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; alpha:/etc/ais # crm_mon --one-shot -V<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; crm_mon[30911]: 2009/10/12_14:39:00 ERROR: unpack_resources: No<br>
&gt;&gt; &gt; &gt; STONITH<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; resources have been defined<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; crm_mon[30911]: 2009/10/12_14:39:00 ERROR: unpack_resources:<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Either<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; configure some or disable STONITH with the stonith-enabled<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; option<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; crm_mon[30911]: 2009/10/12_14:39:00 ERROR: unpack_resources:<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; NOTE:<br>
&gt;&gt; &gt; &gt; &gt; &gt; Clusters<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; with shared data need STONITH to ensure data integrity<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; Thanks,<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; Dejan<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; ============<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Last updated: Mon Oct 12 14:39:00 2009<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Current DC: NONE<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; 0 Nodes configured, unknown expected votes<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; 0 Resources configured.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; ============<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; The errors are regarding the configuration (i have search about<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; them)<br>
&gt;&gt; &gt; &gt; &gt; &gt; that i<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; am unable to do at the moment because &quot;crm configure&quot; cannot<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; connect<br>
&gt;&gt; &gt; &gt; to<br>
&gt;&gt; &gt; &gt; &gt; &gt; the<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; cluster.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Both nodes are running opensuse 11.1 x86_64 with the latest<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; updates<br>
&gt;&gt; &gt; &gt; and<br>
&gt;&gt; &gt; &gt; &gt; &gt; the<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; version that i said above.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Any help is appreciated and please again forgive my lack of<br>
&gt;&gt; &gt; &gt; knowledge.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Thank you in advance.<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Stratos.<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; Pacemaker mailing list<br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; &gt; &gt; &gt; &gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; &gt; &gt; &gt; Pacemaker mailing list<br>
&gt;&gt; &gt; &gt; &gt; &gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; &gt; &gt; &gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt; &gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; Thank you for the immediate response. I know about the errors (I<br>
&gt;&gt; &gt; &gt; &gt; have to<br>
&gt;&gt; &gt; &gt; &gt; disable stonith on the config) but i cannot configure anything with<br>
&gt;&gt; &gt; &gt; &gt; crm.<br>
&gt;&gt; &gt; &gt; &gt; After commit i get something like &quot;node did not respond&quot;<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; The problem is that there is no nodes as you can see after the<br>
&gt;&gt; &gt; &gt; &gt; errors.<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; I want to help to eliminate the problem, but i&#39;m not a programmer.<br>
&gt;&gt; &gt; &gt; &gt; So if<br>
&gt;&gt; &gt; &gt; you<br>
&gt;&gt; &gt; &gt; &gt; can please guide me so i can execute hb_report and provide the<br>
&gt;&gt; &gt; &gt; &gt; necessary<br>
&gt;&gt; &gt; &gt; &gt; logs. When i have to execute hb_report and with what parametes?<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; First check if you have core dumps:<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; # ls -lR /var/lib/heartbeat/cores<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; Then run<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; # hb_report -f &lt;time&gt; -A -n &quot;&lt;nodes&gt;&quot; /tmp/problem-1<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; Replace &lt;time&gt; with whichever time you started cluster at (say<br>
&gt;&gt; &gt; &gt; 13:00). &lt;nodes&gt; with a space separated list of nodes.<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; Thanks,<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; Dejan<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; Again please forgive my luck of knowledge (it is my first time with<br>
&gt;&gt; &gt; &gt; &gt; clusters).<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; Thanks again.<br>
&gt;&gt; &gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; Stratos.<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; &gt; &gt; Pacemaker mailing list<br>
&gt;&gt; &gt; &gt; &gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; &gt; &gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; &gt; Pacemaker mailing list<br>
&gt;&gt; &gt; &gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; &gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt; &gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I don&#39;t think that there are any core dumps. The three folders returned<br>
&gt;&gt; &gt; from<br>
&gt;&gt; &gt; the command are empty.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; alpha:~ # ls -IR /var/lib/heartbeat/cores/<br>
&gt;&gt; &gt; hacluster  nobody  root<br>
&gt;&gt; &gt; alpha:~ #<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; hb_report -f 15:27 -A -n &quot;alpha bravo&quot; -u root /root/problem-3<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; returns<br>
&gt;&gt;<br>
&gt;&gt; The magic is:<br>
&gt;&gt;<br>
&gt;&gt; # ulimit -c unlimited<br>
&gt;&gt;<br>
&gt;&gt; You should put it somewhere so that it is run on boot. For now,<br>
&gt;&gt; just run it before /etc/init.d/openais start.<br>
&gt;&gt;<br>
&gt;&gt; &gt; Password:<br>
&gt;&gt; &gt; alpha: WARN: could not find the log file on alpha<br>
&gt;&gt; &gt; Password: /etc/ha.d/shellfuncs: line 211: maketempdir: command not found<br>
&gt;&gt; &gt; alpha: WARN: sorry, can&#39;t create temoary file for find_files<br>
&gt;&gt; &gt; /etc/ha.d/shellfuncs: line 211: maketempdir: command not found<br>
&gt;&gt; &gt; alpha: WARN: sorry, can&#39;t create temoary file for find_files<br>
&gt;&gt; &gt; /etc/ha.d/shellfuncs: line 211: maketempdir: command not found<br>
&gt;&gt; &gt; /etc/ha.d/shellfuncs: line 211: maketempdir: command not found<br>
&gt;&gt; &gt; alpha: ERROR: cannot create temporary files<br>
&gt;&gt;<br>
&gt;&gt; This looks funny. Can you please show the package versions? And<br>
&gt;&gt; where did the packages come from?<br>
&gt;&gt;<br>
&gt;&gt; Thanks,<br>
&gt;&gt;<br>
&gt;&gt; Dejan<br>
&gt;&gt;<br>
&gt;&gt; &gt; I have attached the generated folder as zip file, but with a quick look,<br>
&gt;&gt; &gt; i<br>
&gt;&gt; &gt; don&#39;t think that has something useful. Maybe its better to guide me how<br>
&gt;&gt; &gt; to<br>
&gt;&gt; &gt; produce dump core files.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I have also tried without the -u option<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Thanks<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Stratos<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; --<br>
&gt;&gt; &gt; Kernel IT Solutions Ltd<br>
&gt;&gt; &gt; <a href="http://www.kernelit.gr" target="_blank">http://www.kernelit.gr</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Cyclades Wireless Network<br>
&gt;&gt; &gt; <a href="http://www.cywn.gr" target="_blank">http://www.cywn.gr</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; Pacemaker mailing list<br>
&gt;&gt; &gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; &gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; Pacemaker mailing list<br>
&gt;&gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt;&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; After i have reinstalled all the packages, i&#39;m running for about half an<br>
&gt; hour without segfault.<br>
&gt;<br>
&gt; crm_mon still reports:<br>
&gt; ============<br>
&gt; Last updated: Mon Oct 12 19:02:43 2009<br>
&gt; Current DC: NONE<br>
&gt; 0 Nodes configured, unknown expected votes<br>
&gt; 0 Resources configured.<br>
&gt; ============<br>
&gt;<br>
&gt; and when i try to &quot;commit&quot; a configuration (through crm configure) i get a<br>
&gt; &quot;Remote node did not respond&quot;<br>
&gt;<br>
&gt; What i have to to do to make the nodes appear? (at least until a segfault<br>
&gt; occurs and we have a core dump)<br>
&gt;<br>
&gt; I&#39;m attaching my /var/log/messages from the first node after the last run of<br>
&gt; openais.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list<br>
&gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt;<br>
<br>
_______________________________________________<br>
Pacemaker mailing list<br>
<a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
</div></div></blockquote></div><br>After restarting in debug mode i have a segfault.<br><br>I&#39;m attaching a core file found in /var/lib/heartbeat/cores/hacluster.<br><br>Hope it helps....<br clear="all"><br>-- <br>Kernel IT Solutions Ltd<br>
<a href="http://www.kernelit.gr">http://www.kernelit.gr</a><br><br>Cyclades Wireless Network<br><a href="http://www.cywn.gr">http://www.cywn.gr</a><br>