Andrew,<br><br>I can confirm that the bug is gone in 1.1.8 or at least I cannot trigger it anymore.<br><br>Cheers.<br><br><div class="gmail_quote">On Tue, Sep 11, 2012 at 10:51 AM, Andrew Beekhof <span dir="ltr">&lt;<a href="mailto:andrew@beekhof.net" target="_blank">andrew@beekhof.net</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On Tue, Sep 11, 2012 at 4:58 PM, Borislav Borisov<br>
&lt;<a href="mailto:borislav.v.borisov@gmail.com">borislav.v.borisov@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; Pacemaker creates a second cib process to write the contents to disk<br>
&gt;&gt; after a change so that the &#39;real&#39; process doesn&#39;t block.<br>
&gt;&gt;<br>
&gt;&gt; After the process writes the cib to disk, we then try to read it back<br>
&gt;&gt; again to verify that everything is sane.<br>
&gt;&gt; What you&#39;re seeing here is that check failing for some reason.<br>
&gt;<br>
&gt;<br>
&gt; Because this much I could tell from the code, I was perplexed from that<br>
&gt; behavior.<br>
<br>
</div>Would you not say its better to know /now/ that what we wrote to disk<br>
is unusable (or just not what you intended)?<br>
Or would you prefer to find out the next time the node booted :)<br>
<br>
Either way, Pacemaker will continue to function normally - the current<br>
CIB just wont be written to disk on that one node.<br>
<div class="im HOEnZb"><br>
&gt;&gt;<br>
&gt;&gt; Looking at the logs I see:<br>
&gt;&gt;<br>
&gt;&gt; Sep 10 15:24:40 Cluster-Server-1 cib: [54564]: ERROR:<br>
&gt;&gt; validate_cib_digest: Digest comparision failed: expected<br>
&gt;&gt; 83751b899e758f9b138d060ace084080 (/var/lib/heartbeat/crm/cib.ANRY1Q),<br>
&gt;&gt; calculated bd97ef3df10846e783bd64059be77e45<br>
&gt;&gt; Sep 10 15:24:40 Cluster-Server-1 cib: [54564]: ERROR: retrieveCib:<br>
&gt;&gt; Checksum of /var/lib/heartbeat/crm/cib.uGGnOm failed!  Configuration<br>
&gt;&gt; contents ignored!<br>
&gt;&gt;<br>
&gt;&gt; Which is really strange.<br>
&gt;&gt; I see a couple of changes in related areas since 1.1.7, perhaps one of<br>
&gt;&gt; those will fix your issue.<br>
&gt;&gt; (1.1.8 should be out today/tomorrow)<br>
&gt;<br>
&gt;<br>
&gt; I guess that I will wait for the next release and see if the issue is fixed<br>
&gt; in it.<br>
&gt;<br>
&gt; Anyway, thanks a bunch Andrew.<br>
&gt;<br>
&gt;<br>
</div><div class="HOEnZb"><div class="h5">&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt;<br>
&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
&gt;<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br>