<p>OCF script for bind was recently added to cluster-resources on gorging. Could you please try to use that one?</p>
<div class="gmail_quote">On Sep 30, 2011 2:09 AM, &quot;Gerald Vogt&quot; &lt;<a href="mailto:vogt@spamcop.net">vogt@spamcop.net</a>&gt; wrote:<br type="attribution">&gt; Hi!<br>&gt; <br>&gt; I am running a cluster with 3 nodes. These nodes provide dns service.<br>
&gt; The purpose of the cluster is to have our two dns service ip addresses<br>&gt; online at all times. I use IPaddr2 and that part works.<br>&gt; <br>&gt; Now I try to extend our setup to check the dns service itself. So far,<br>
&gt; if a dns server on any node stops or hangs the cluster won&#39;t notice.<br>&gt; Thus, I wrote a custom ocf script to check whether the dns service on<br>&gt; a node is operational (i.e. if the dns server is listening on the ip<br>
&gt; address and whether it responds to a dns request).<br>&gt; <br>&gt; All cluster nodes are slave dns servers, therefore the dns server<br>&gt; process is running at all times to get zone transfers from the dns<br>&gt; master.<br>
&gt; <br>&gt; Obviously, the dns service resource must be colocated with the IP<br>&gt; address resource. However, as the dns server is running at all times,<br>&gt; the dns service resource must be started or stopped after the ip<br>
&gt; address. This leads me to something like this:<br>&gt; <br>&gt; primitive ns1-ip ocf:heartbeat:IPaddr2 ...<br>&gt; primitive ns1-dns ocf:custom:dns op monitor interval=&quot;30s&quot;<br>&gt; <br>&gt; colocation dns-ip1 inf: ns1-dns ns1-ip<br>
&gt; order ns1-ip-dns inf: ns1-ip ns1-dns symmetrical=false<br>&gt; <br>&gt; Problem 1: it seems as if the order constraint does not wait for an<br>&gt; operation on the first resource to finish before it starts the<br>&gt; operation on the second. When I migrate an IP address to another node<br>
&gt; the stop operation on ns1-dns will fail because the ip address is<br>&gt; still active on the network interface. I have worked around this by<br>&gt; checking for the IP address on the interface in the stop part of my<br>
&gt; dns script and sleeping 5 seconds if it is still there before checking<br>&gt; again and continuing.<br>&gt; <br>&gt; Shouldn&#39;t the stop on ns1-ip first finish before the node initiates<br>&gt; the stop on ns1-dns?<br>
&gt; <br>&gt; Problem 2: if the dns service fails, e.g. hangs, the monitor operation<br>&gt; fails. Thus, the cluster wants to migrate the ip address and service<br>&gt; to another node. However, it first initiates a stop on ns1-dns and<br>
&gt; then on ns1-ip.<br>&gt; <br>&gt; What I need is ns1-ip to stop before ns1-dns. But this seems<br>&gt; impossible to configure. The order constraint only says what operation<br>&gt; is executed on ns1-dns depending on the status of ns1-ip. It says what<br>
&gt; happens after something. It cannot say what happens before something.<br>&gt; Is that correct? Or am I missing a configuration option?<br>&gt; <br>&gt; Thanks,<br>&gt; <br>&gt; Gerald<br>&gt; <br>&gt; _______________________________________________<br>
&gt; Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
&gt; <br>&gt; Project Home: <a href="http://www.clusterlabs.org">http://www.clusterlabs.org</a><br>&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
&gt; Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br></div>