Hi NIkita<br>I reverted to an early snapshot and started again i now have ping d running but when i remove the eth0 the resource does not failover <br><br>i can see in the ha-log that the ping detects the network is gone but it does not move the resource. Can anyone see the error in my config?<br>
<br><br>node $id=&quot;271808bb-ed74-4eaa-8c94-bf32a00074dd&quot; node1 \<br>        attributes standby=&quot;off&quot;<br>node $id=&quot;59440607-2a5c-450e-84fa-94bf69742671&quot; node2 \<br>        attributes standby=&quot;off&quot;<br>
primitive MYPING ocf:pacemaker:pingd \<br>        params host_list=&quot;10.100.0.254&quot; multiplier=&quot;1000&quot; \<br>        op monitor interval=&quot;15s&quot; timeout=&quot;20s&quot; \<br>        op start interval=&quot;0&quot; timeout=&quot;90s&quot; \<br>
        op stop interval=&quot;0&quot; timeout=&quot;100s&quot;<br>primitive crhweb ocf:heartbeat:apache \<br>        params configfile=&quot;/etc/httpd/conf/httpd.conf&quot; \<br>        op monitor interval=&quot;60s&quot; \<br>
        meta target-role=&quot;Started&quot;<br>primitive failoverip ocf:heartbeat:IPaddr \<br>        params ip=&quot;10.100.1.100&quot; cidr_netmask=&quot;255.255.0.0&quot; \<br>        op monitor interval=&quot;30s&quot;<br>
clone MYPINGCLONE MYPING \<br>        meta globally-unique=&quot;false&quot;<br>location web_location crhweb \<br>        rule $id=&quot;web_location-rule&quot; -inf: not_defined pingd or pingd lte 0<br>colocation crhweb-with-failoverip inf: crhweb failoverip<br>
order crhweb-after-failoverip inf: MYPINGCLONE failoverip crhweb<br>property $id=&quot;cib-bootstrap-options&quot; \<br>        dc-version=&quot;1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3&quot; \<br>        cluster-infrastructure=&quot;Heartbeat&quot; \<br>
        stonith-enabled=&quot;false&quot; \<br>        no-quorum-policy=&quot;ignore&quot;<br>rsc_defaults $id=&quot;rsc-options&quot; \<br>        resource-stickiness=&quot;100&quot;<br><br><br>HA_LOG<br><br>Jan 28 11:17:42 node1 heartbeat: [2872]: ERROR: glib: Error sending packet: Network is unreachable<br>
Jan 28 11:17:42 node1 heartbeat: [2872]: info: glib: euid=0 egid=0<br>Jan 28 11:17:42 node1 heartbeat: [2872]: ERROR: write_child: write failure on ping 10.100.0.254.: Network is unreachable<br>Jan 28 11:17:43 node1 pingd: [6004]: WARN: ping_write: Wrote -1 of 39 chars: Network is unreachable (101<br>
<br><br><br><div class="gmail_quote">On 1 February 2011 09:35, paul harford <span dir="ltr">&lt;<a href="mailto:harfordmeister@gmail.com">harfordmeister@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi NIkita<br>Many thanks for your assistance, i updated the changes you noticed but now my 2 nodes just keep rebooting, did i enter something incorrectly in the pingd directive ?<br><br>Paul<br><br><br>i can see these errors in the messages log and my configuration is below<br>

<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: clone_print:  Clone Set: connected<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: short_print:      Stopped: [ pingd:0 pingd:1 ]<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: info: rsc_merge_weights: failoverip: Rolling back scores from crhweb<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: info: native_color: Resource crhweb cannot run anywhere<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: RecurringOp:  Start recurring monitor (10s) for pingd:0 on crhnode2<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Operation pingd-monitor-5s-0 is a duplicate of pingd-monitor-5s<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Do not use the same (name, interval) combination more than once per resource<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Operation pingd-monitor-5s-0 is a duplicate of pingd-monitor-5s<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Do not use the same (name, interval) combination more than once per resource<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: RecurringOp:  Start recurring monitor (10s) for pingd:1 on crhnode1<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Operation pingd-monitor-5s-0 is a duplicate of pingd-monitor-5s<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Do not use the same (name, interval) combination more than once per resource<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Operation pingd-monitor-5s-0 is a duplicate of pingd-monitor-5s<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: ERROR: is_op_dup: Do not use the same (name, interval) combination more than once per resource<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: LogActions: Leave resource failoverip (Started crhnode1)<br>

Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: LogActions: Stop resource crhweb      (crhnode1)<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: LogActions: Start pingd:0     (crhnode2)<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: notice: LogActions: Start pingd:1     (crhnode1)<br>

Feb  1 09:01:06 crhnode2 crmd: [3742]: info: do_state_transition: State transition S_POLICY_ENGINE -&gt; S_TRANSITION_ENGINE [ input=I_PE_SUCCESS cause=C_IPC_MESSAGE origin=handle_response ]<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: info: process_pe_message: Transition 59: PEngine Input stored in: /var/lib/pengine/pe-input-82.bz2<br>

Feb  1 09:01:06 crhnode2 crmd: [3742]: info: unpack_graph: Unpacked transition 59: 14 actions in 14 synapses<br>Feb  1 09:01:06 crhnode2 pengine: [4103]: info: process_pe_message: Configuration ERRORs found during PE processing.  Please run &quot;crm_verify -L&quot; to identify issues.<br>

<br><br><br>here is my current configuration<div class="im"><br><br>node $id=&quot;271808bb-ed74-4eaa-8c94-bf32a00074dd&quot; crhnode1 \<br>        attributes standby=&quot;off&quot;<br>node $id=&quot;59440607-2a5c-450e-84fa-94bf69742671&quot; crhnode2 \<br>

        attributes standby=&quot;off&quot;<br></div>primitive crhweb ocf:heartbeat:apache \<div class="im"><br>        params configfile=&quot;/etc/httpd/conf/httpd.conf&quot; \<br>        op monitor interval=&quot;60s&quot; \<br>
        meta target-role=&quot;Started&quot;<br>
primitive failoverip ocf:heartbeat:IPaddr \<br>        params ip=&quot;10.100.1.100&quot; cidr_netmask=&quot;255.255.0.0&quot; \<br>        op monitor interval=&quot;30s&quot; \<br>        meta target-role=&quot;Started&quot;<br>
</div>
primitive pingd ocf:pacemaker:pingd \<br>        params dampen=&quot;5s&quot; host_list=&quot;10.100.0.254&quot; multiplier=&quot;1000&quot; name=&quot;pingval&quot; \<br>        operations $id=&quot;pingd-operations&quot; \<br>

        op monitor interval=&quot;10s&quot; timeout=&quot;20s&quot; \<br>        op monitor interval=&quot;90s&quot; timeout=&quot;25s&quot; start \<br>        op monitor interval=&quot;100s&quot; timeout=&quot;25s&quot; stop<br>

clone connected pingd \<div class="im"><br>        meta globally-unique=&quot;false&quot; target-role=&quot;started&quot;<br></div>location cli-prefer-crhweb crhweb \<div class="im"><br>        rule $id=&quot;cli-prefer-rule-crhweb&quot; inf: #uname eq crhnode1<br>
</div>
location crhweb_on_connected_node crhweb \<br>        rule $id=&quot;crhweb_on_connected_node-rule&quot; -inf: not_defined pingval or pingval lte 0<div class="im"><br>location prefer-crhnode1 crhweb 50: crhnode1<br></div>
colocation crhweb-with-failoverip inf: crhweb failoverip<br>
order crhweb-after-failoverip inf: pingd failoverip crhweb<div class="im"><br>property $id=&quot;cib-bootstrap-options&quot; \<br>        dc-version=&quot;1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3&quot; \<br>        cluster-infrastructure=&quot;Heartbeat&quot; \<br>

        stonith-enabled=&quot;false&quot; \<br>        no-quorum-policy=&quot;ignore&quot;<br><br><br><br></div><div><div></div><div class="h5"><div class="gmail_quote">On 1 February 2011 07:21, Nikita Michalko <span dir="ltr">&lt;<a href="mailto:michalko.system@a-i-p.com" target="_blank">michalko.system@a-i-p.com</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hi Paul,<br>
<br>
see below!<br>
<br>
Am Montag, 31. Januar 2011 19:55 schrieb paul harford:<br>
<div>&gt; HI guys<br>
&gt; i&#39;m having some issues with a ping directive, my current config is below<br>
&gt; and basically i want the web resource to failover to the second node if the<br>
&gt; ping can no longer contact the default gateway<br>
&gt;<br>
&gt; so here goes<br>
&gt;<br>
&gt; crm configure primitive ping ocf:pacemaker:ping params dampen=5s<br>
&gt; host_list=(default GateWay) multplier=1000 name=pingval operations<br>
&gt; $id=ping-operations op moinitor interval=10s timeout=15s<br>
<br>
</div> - this is surely wrong: &quot;moinitor&quot; ?<br>
 - no such primitive (ping) below ...<br>
<br>
HTH<br>
<br>
Nikita Michalko<br>
<div><div></div><div><br>
<br>
&gt;<br>
&gt; and<br>
&gt;<br>
&gt; crm configure clone connected ping meta globally-unique=false<br>
&gt; target-role=started<br>
&gt;<br>
&gt; and<br>
&gt;<br>
&gt; location web_on_connected_node cweb rule $id=web_on_connected_node-rule<br>
&gt; -inf: not_defined pingval or pingval lte 0<br>
&gt;<br>
&gt;<br>
&gt; Does anyone see any isssues&#39;s whith the above confiuguration ? i want to<br>
&gt; check first as the last time i tried it wouldn&#39;t work and my resources<br>
&gt; would not failover or start<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; node $id=&quot;271808bb-ed74-4eaa-8c94-bf32a00074dd&quot; crhnode1 \<br>
&gt;         attributes standby=&quot;off&quot;<br>
&gt; node $id=&quot;59440607-2a5c-450e-84fa-94bf69742671&quot; crhnode2 \<br>
&gt;         attributes standby=&quot;off&quot;<br>
&gt; primitive cweb ocf:heartbeat:apache \<br>
&gt;         params configfile=&quot;/etc/httpd/conf/httpd.conf&quot; \<br>
&gt;         op monitor interval=&quot;60s&quot; \<br>
&gt;         meta target-role=&quot;Started&quot;<br>
&gt; primitive failoverip ocf:heartbeat:IPaddr \<br>
&gt;         params ip=&quot;10.100.1.100&quot; cidr_netmask=&quot;255.255.0.0&quot; \<br>
&gt;         op monitor interval=&quot;30s&quot; \<br>
&gt;         meta target-role=&quot;Started&quot;<br>
&gt; location cli-prefer-cweb cweb \<br>
&gt;         rule $id=&quot;cli-prefer-rule-crhweb&quot; inf: #uname eq crhnode1<br>
&gt; location prefer-crhnode1 crhweb 50: crhnode1<br>
&gt; colocation cweb-with-failoverip inf: cweb failoverip<br>
&gt; order crhweb-after-failoverip inf: failoverip cweb<br>
&gt; property $id=&quot;cib-bootstrap-options&quot; \<br>
&gt;         dc-version=&quot;1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3&quot; \<br>
&gt;         cluster-infrastructure=&quot;Heartbeat&quot; \<br>
&gt;         stonith-enabled=&quot;false&quot; \<br>
&gt;         no-quorum-policy=&quot;ignore&quot;<br>
&gt; rsc_defaults $id=&quot;rsc-options&quot; \<br>
&gt;         resource-stickiness=&quot;100&quot;<br>
<br>
</div></div>_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>
</blockquote></div><br>
</div></div></blockquote></div><br>