<br><br><div class="gmail_quote">On 18 October 2010 04:03, Tim Serong <span dir="ltr">&lt;<a href="mailto:tserong@novell.com">tserong@novell.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<div class="im">On 10/16/2010 at 09:45 AM, Jai &lt;<a href="mailto:awayatm@gmail.com">awayatm@gmail.com</a>&gt; wrote:<br>
&gt; I have setup a DRBD-&gt;Xen failover cluster. Last night at around 02:50 it failed<br>
&gt; the resources from server &quot;bravo&quot; to &quot;alpha&quot;. I&#39;m trying to find out what<br>
&gt; caused the failover of resources. I don&#39;t see anything in the logs that<br>
&gt; indicate the cause but I don&#39;t really know what to look for. If someone could<br>
&gt; help me understand these logs and what I&#39;m looking for would be great. I&#39;m<br>
&gt; not even sure how far back I need to go.<br>
<br>
</div>I reckon it&#39;s this:<br>
<div class="im"><br>
Oct 16 02:46:04 bravo attrd: [25098]: info: attrd_perform_update: Sent update 161: pingval=0<br>
<br>
</div>Which suggests bravo lost connectivity to 12.12.12.1 around that time, causing<br>
the failover.<br>
<br>
For reference, if you&#39;re looking at pengine logs...  A few lines above where<br>
it says &quot;info: process_pe_message: Transition NNN: PEngine Input stored in:<br>
/var/lib/pengine/pe-input-MMM.bz2&quot;, you&#39;ll see what it&#39;s about to do to your<br>
resources.  If this is just: &quot;Leave resource FOO (Started/Master/Slave etc.)&quot;<br>
that transition is probably boring.  If it says &quot;Start FOO (...)&quot; or<br>
&quot;Promote/Demote/Stop FOO (...)&quot;, it means something has changed.  Scroll up<br>
a bit, to above where pengine is saying &quot;unpack_config&quot;, &quot;determine_node_status&quot;<br>
etc. and you should see a message suggesting the cause for the change (failed<br>
op, timeout, ping attribute modified, etc.)  It might be a bit inscrutable<br>
sometimes, but it&#39;ll be there somewhere...<br>
<br>
HTH<br>
<br></blockquote></div><br>These are very useful tips on understanding the logs<br>Pavlos<br><br>