<div dir="ltr">Yes, it avoids the crashes.  Thanks!  But I am still seeing spurious VM migrations/shutdowns when I stop/start a VM with a remote pacemaker (similar to my last update, only no core dumped while fencing, nor indeed does any fencing happen, even though I&#39;ve now verified that fence_node works again.</div>
<div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Jul 10, 2013 at 2:12 PM, David Vossel <span dir="ltr">&lt;<a href="mailto:dvossel@redhat.com" target="_blank">dvossel@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">----- Original Message -----<br>
&gt; From: &quot;Lindsay Todd&quot; &lt;<a href="mailto:rltodd.ml1@gmail.com">rltodd.ml1@gmail.com</a>&gt;<br>
&gt; To: &quot;The Pacemaker cluster resource manager&quot; &lt;<a href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a>&gt;<br>
</div><div class="im">&gt; Sent: Wednesday, July 10, 2013 12:11:00 PM<br>
&gt; Subject: Re: [Pacemaker] Pacemaker remote nodes, naming, and attributes<br>
&gt;<br>
</div><div class="im">&gt; Hmm, I&#39;ll still submit the bug report, but it seems like crmd is dumping core<br>
&gt; while attempting to fence a node. If I use fence_node to fence a real<br>
&gt; cluster node, that also causes crmd to dump core. But apart from that, I<br>
&gt; don&#39;t really see why pacemaker is trying to fence anything.<br>
<br>
</div>This should solve the crashes you are seeing.<br>
<br>
<a href="https://github.com/ClusterLabs/pacemaker/commit/97dd3b05db867c4674fa4780802bba54c63bd06d" target="_blank">https://github.com/ClusterLabs/pacemaker/commit/97dd3b05db867c4674fa4780802bba54c63bd06d</a><br>
<span class="HOEnZb"><font color="#888888"><br>
-- Vossel<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt;<br>
&gt; On Wed, Jul 10, 2013 at 12:42 PM, Lindsay Todd &lt; <a href="mailto:rltodd.ml1@gmail.com">rltodd.ml1@gmail.com</a> &gt;<br>
&gt; wrote:<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Thanks! But there is still a problem.<br>
&gt;<br>
&gt; I am now working from the master branch and building RPMs (well, I have to<br>
&gt; also rebuild from the srpm to change the build number, since the RPMs built<br>
&gt; directly are always 1.1.10-1). The patch is in the git log, and indeed<br>
&gt; things are better ... But I still see the spurious VMs shutting down. What<br>
&gt; is much improved is that they do get restarted, and basically I end up in<br>
&gt; the state I want to be. Can almost live with this, and I was going to start<br>
&gt; changing my cluster config to be asymmetric when I noticed the in the midst<br>
&gt; of the spurious transitions, crmd is dumping core.<br>
&gt;<br>
&gt; So I&#39;ll append another crm_report to bug 5164, as well as a gdb traceback.<br>
&gt;<br>
&gt;<br>
&gt; On Fri, Jul 5, 2013 at 5:06 PM, David Vossel &lt; <a href="mailto:dvossel@redhat.com">dvossel@redhat.com</a> &gt; wrote:<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; ----- Original Message -----<br>
&gt; &gt; From: &quot;David Vossel&quot; &lt; <a href="mailto:dvossel@redhat.com">dvossel@redhat.com</a> &gt;<br>
&gt; &gt; To: &quot;The Pacemaker cluster resource manager&quot; &lt;<br>
&gt; &gt; <a href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a> &gt;<br>
&gt; &gt; Sent: Wednesday, July 3, 2013 4:20:37 PM<br>
&gt; &gt; Subject: Re: [Pacemaker] Pacemaker remote nodes, naming, and attributes<br>
&gt; &gt;<br>
&gt; &gt; ----- Original Message -----<br>
&gt; &gt; &gt; From: &quot;Lindsay Todd&quot; &lt; <a href="mailto:rltodd.ml1@gmail.com">rltodd.ml1@gmail.com</a> &gt;<br>
&gt; &gt; &gt; To: &quot;The Pacemaker cluster resource manager&quot;<br>
&gt; &gt; &gt; &lt; <a href="mailto:pacemaker@oss.clusterlabs.org">pacemaker@oss.clusterlabs.org</a> &gt;<br>
&gt; &gt; &gt; Sent: Wednesday, July 3, 2013 2:12:05 PM<br>
&gt; &gt; &gt; Subject: Re: [Pacemaker] Pacemaker remote nodes, naming, and attributes<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Well, I&#39;m not getting failures right now simply with attributes, but I<br>
&gt; &gt; &gt; can<br>
&gt; &gt; &gt; induce a failure by stopping the vm-db02 (it puts db02 into an unclean<br>
&gt; &gt; &gt; state, and attempts to migrate the unrelated vm-compute-test). I&#39;ve<br>
&gt; &gt; &gt; collected the commands from my latest interactions, a crm_report, and a<br>
&gt; &gt; &gt; gdb<br>
&gt; &gt; &gt; traceback from the core file that crmd dumped, into bug 5164.<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Thanks, hopefully I can start investigating this Friday<br>
&gt; &gt;<br>
&gt; &gt; -- Vossel<br>
&gt;<br>
&gt; Yeah, this is a bad one. Adding the node attributes using crm_attribute for<br>
&gt; the remote-node did some unexpected things to the crmd component. Somehow<br>
&gt; the remote-node was getting entered into the cluster node cache... which<br>
&gt; made it look like we had both a cluster-node and remote-node named the same<br>
&gt; thing... not good.<br>
&gt;<br>
&gt; I think I got that part worked out. Try this patch.<br>
&gt;<br>
&gt; <a href="https://github.com/ClusterLabs/pacemaker/commit/67dfff76d632f1796c9ded8fd367aa49258c8c32" target="_blank">https://github.com/ClusterLabs/pacemaker/commit/67dfff76d632f1796c9ded8fd367aa49258c8c32</a><br>
&gt;<br>
&gt; Rather than trying to patch RCs, it might be worth trying out the master<br>
&gt; branch on github (which already has this patch). If you aren&#39;t already, use<br>
&gt; rpms to make your life easier. Running &#39;make rpm&#39; in the source directory<br>
&gt; will generate them for you.<br>
&gt;<br>
&gt; There was another bug fixed recently in pacemaker_remote involving the<br>
&gt; directory created for resource agents to store their temporary data (stuff<br>
&gt; like pid files). I believe the fix was not introduced until 1.1.10rc6.<br>
&gt;<br>
&gt; -- Vossel<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br></div>