<br><div class="gmail_quote">On 2 November 2010 13:18, Dejan Muhamedagic <span dir="ltr">&lt;<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Hi,<br>
<div class="im"><br>
On Tue, Nov 02, 2010 at 01:09:02PM +0100, Pavlos Parissis wrote:<br>
&gt; On 2 November 2010 13:02, Dejan Muhamedagic &lt;<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a>&gt; wrote:<br>
&gt; [...snip...]<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; Definitely not. If you do the monitor action from the command<br>
&gt; &gt; &gt; &gt; line does that also return the unexpected exit code:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; from the code I pasted you can see it returned 1.<br>
&gt; &gt;<br>
&gt; &gt; There is a difference. stonith-ng (stonithd) is a daemon that<br>
&gt; &gt; runs a perl script (fencing_legacy) which invokes stonith which<br>
&gt; &gt; then invokes the plugin. A problem can occur in any of these<br>
&gt; &gt; components. It&#39;s important to find out where.<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; # stonith -t external/rackpdu community=&quot;empisteftiko&quot;<br>
&gt; &gt; &gt; &gt; names_oid=&quot;.1.3.6.1.4.1.318.1.1.4.4.2.1.4&quot; ... -lS<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Which pacemaker release do you run? I couldn&#39;t reproduce this<br>
&gt; &gt; &gt; &gt; with a recent Pacemaker.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; that it was on 1.1.3 and now I run 1.0.9.<br>
&gt; &gt; &gt; Do you want me to run the test on 1.0.9?<br>
&gt; &gt;<br>
&gt; &gt; Yes, please. 1.0.9 is still running the old, and well tested,<br>
&gt; &gt; stonithd, so the result could be different.<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; I have the pdu off because it stopped working anymore! As a result the<br>
&gt; resource is stopped.<br>
&gt; But I did the test I see that even rackpdu returns 1 on status stonithd<br>
&gt; reports 256<br>
<br>
</div>Ah, I understand what&#39;s going on now. It&#39;s a bug in the interface<br>
to external plugins which was exposed by stonith-ng. It has been<br>
fixed in August. The fix is here (in <a href="http://hg.linux-ha.org/glue" target="_blank">hg.linux-ha.org/glue</a>):<br>
<br>
changeset:   2427:b7df127fc09e<br>
user:        Dejan Muhamedagic &lt;<a href="mailto:dejan@hello-penguin.com">dejan@hello-penguin.com</a>&gt;<br>
date:        Thu Aug 12 14:01:10 2010 +0200<br>
summary:     High: stonith: external: interpret properly exit codes from external stonith plugins (bnc#630357)<br>
<br>
There hasn&#39;t been a glue release since then, but there should be<br>
one fairly soon. Note that this affects only Pacemaker 1.1.<br>
<br>
Thanks,<br>
<font color="#888888"><br>
Dejan<br>
</font><div><div></div><div class="h5"><br>
<br><br></div></div></blockquote><div><br></div><div>Does this bug have to do anything with PE ignoring monitor failure?</div><div>Pavlos</div><div><br></div></div>