I checked to verify that there were no other openais or corosync processes running.<br><br>I think that crm_signal_dispatch signal termination message you saw was me manually killing the corosync process tree, or at least attempting to stop things.  I&#39;ve attached a new trace that shows me running corosync for a good six minutes before attempting to kill it.  You still see the crm_signal_dispatch about six minutes in when I&#39;m attempting to shut things down.  I&#39;m not sure it&#39;s a symptom of the actual underlying problem (of course, I could be wrong).<br>
<br>Any other ideas?  Anything additional I could enable in terms of logging / debugging that might show useful diagnostic info?<br><br>Thanks,<br>Brian<br><br><br><div class="gmail_quote">On Fri, Dec 11, 2009 at 2:13 AM, Andrew Beekhof <span dir="ltr">&lt;<a href="mailto:andrew@beekhof.net">andrew@beekhof.net</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Could you check the ps axf output for a second corosync or openais process?<br>
Something out there is sending SIGTERM to the pacemaker daemons:<br>
<br>
Dec 10 11:48:12 localhost pengine: [23775]: info: crm_signal_dispatch:<br>
Invoking handler for signal 15: Terminated<br>
<div><div></div><div class="h5"><br>
On Thu, Dec 10, 2009 at 9:02 PM, Brian Ferris &lt;<a href="mailto:bdferris@gmail.com">bdferris@gmail.com</a>&gt; wrote:<br>
&gt; I&#39;m running pacemaker-1.0.6 and corosync-1.1.2 on Fedora 11 using rpms<br>
&gt; available from <a href="http://clusterlabs.org" target="_blank">clusterlabs.org</a>.<br>
&gt;<br>
&gt; I&#39;m new to this stuff, and I&#39;ve been having some trouble getting things<br>
&gt; started.  Specifically, I&#39;m seeing the following messages in my logs when I<br>
&gt; attempt to startup corosync:<br>
&gt;<br>
&gt; Dec 10 11:47:47 localhost attrd: [23774]: info: init_ais_connection:<br>
&gt; Creating connection to our AIS plugin<br>
&gt; Dec 10 11:47:47 localhost attrd: [23774]: info: init_ais_connection:<br>
&gt; Connection to our AIS plugin (9) failed: Try again (6)<br>
&gt;<br>
&gt; I see that same sequence of messages for attrd, cib, stonithd.  They are<br>
&gt; repeated endlessly until the programs decide to stop retrying.  This seems<br>
&gt; to be the closest thing I can find to a root error, but I&#39;m not sure how to<br>
&gt; address this.<br>
&gt;<br>
&gt; I&#39;ve attached my full message log, my corosync.conf, and cib.xml file, if<br>
&gt; any of that helps.<br>
&gt;<br>
&gt; Any ideas?<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Brian<br>
&gt;<br>
</div></div>&gt; _______________________________________________<br>
&gt; Pacemaker mailing list<br>
&gt; <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt;<br>
<br>
_______________________________________________<br>
Pacemaker mailing list<br>
<a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
</blockquote></div><br>