<html><body><div style="color:#000; background-color:#fff; font-family:verdana, helvetica, sans-serif;font-size:10pt"><div><span>nope. Am not using stonith.<br></span></div><div><br></div><div style="font-family: verdana,helvetica,sans-serif; font-size: 10pt;"><div style="font-family: times new roman,new york,times,serif; font-size: 12pt;"><font face="Arial" size="2"><hr size="1"><b><span style="font-weight: bold;">From:</span></b> Andreas Kurz &lt;andreas@hastexo.com&gt;<br><b><span style="font-weight: bold;">To:</span></b> pacemaker@oss.clusterlabs.org<br><b><span style="font-weight: bold;">Sent:</span></b> Monday, 14 November 2011 6:08 PM<br><b><span style="font-weight: bold;">Subject:</span></b> Re: [Pacemaker] killing corosync leaves crmd, stonithd, lrmd, cib and attrd to hog up the cpu<br></font><br>On 11/14/2011 12:32 PM, ihjaz Mohamed wrote:<br>&gt; Hi All,<br>&gt; <br>&gt; As part of some robustness test for my cluster, I tried killing
 the<br>&gt; corosync process using kill -9 &lt;pid&gt;. After this I see that the<br>&gt; pacemakerd service is stopped but the processes crmd, stonithd, lrmd,<br>&gt; cib and attrd are still running and are hogging up the cpu.<br><br>Then fix your stonith setup if you want a "robust" cluster setup .... of<br>course you are using stonith, aren't you?<br><br>Regards,<br>Andreas<br><br>-- <br>Need help with Pacemaker?<br><a href="http://www.hastexo.com/now" target="_blank">http://www.hastexo.com/now</a><br><br>&gt; <br>&gt; <br>&gt; top - 06:26:51 up&nbsp; 2:01,&nbsp; 4 users,&nbsp; load average: 12.04, 12.01, 11.98<br>&gt; Tasks: 330 total,&nbsp; 13 running, 317 sleeping,&nbsp;  0 stopped,&nbsp;  0 zombie<br>&gt; Cpu(s):&nbsp; 7.1%us, 17.1%sy,&nbsp; 0.0%ni, 75.6%id,&nbsp; 0.1%wa,&nbsp; 0.0%hi,&nbsp; 0.0%si, <br>&gt; 0.0%st<br>&gt; Mem:&nbsp;  8015444k total,&nbsp; 4804412k used,&nbsp; 3211032k free,&nbsp; &nbsp; 54800k buffers<br>&gt; Swap: 10256376k
 total,&nbsp; &nbsp; &nbsp; &nbsp; 0k used, 10256376k free,&nbsp; 1604464k cached<br>&gt; <br>&gt;&nbsp;  PID USER&nbsp; &nbsp; &nbsp; PR&nbsp; NI&nbsp; VIRT&nbsp; RES&nbsp; SHR S %CPU %MEM&nbsp; &nbsp; TIME+&nbsp; COMMAND<br>&gt;&nbsp; 2053 hacluste&nbsp; RT&nbsp;  0 90492 3324 2476 R 100.0&nbsp; 0.0 113:40.61 crmd<br>&gt;&nbsp; 2047 root&nbsp; &nbsp; &nbsp; RT&nbsp;  0 81480 2108 1712 R 99.8&nbsp; 0.0 113:40.43 stonithd<br>&gt;&nbsp; 2048 hacluste&nbsp; RT&nbsp;  0 83404 5260 2992 R 99.8&nbsp; 0.1 113:40.90 cib<br>&gt;&nbsp; 2050 hacluste&nbsp; RT&nbsp;  0 85896 2388 1952 R 99.8&nbsp; 0.0 113:40.43 attrd<br>&gt;&nbsp; 5018 root&nbsp; &nbsp; &nbsp; 20&nbsp;  0 8787m 345m&nbsp; 56m S&nbsp; 2.0&nbsp; 4.4&nbsp;  0:56.95 java<br>&gt; 19017 root&nbsp; &nbsp; &nbsp; 20&nbsp;  0 15068 1252&nbsp; 796 R&nbsp; 2.0&nbsp; 0.0&nbsp;  0:00.01 top<br>&gt;&nbsp; &nbsp;  1 root&nbsp; &nbsp; &nbsp; 20&nbsp;  0 19232 1444 1156 S&nbsp; 0.0&nbsp; 0.0&nbsp;  0:01.71
 init<br>&gt;&nbsp; &nbsp;  2 root&nbsp; &nbsp; &nbsp; 20&nbsp;  0&nbsp; &nbsp;  0&nbsp; &nbsp; 0&nbsp; &nbsp; 0 S&nbsp; 0.0&nbsp; 0.0&nbsp;  0:00.00 kthreadd<br>&gt;&nbsp; &nbsp;  3 root&nbsp; &nbsp; &nbsp; RT&nbsp;  0&nbsp; &nbsp;  0&nbsp; &nbsp; 0&nbsp; &nbsp; 0 S&nbsp; 0.0&nbsp; 0.0&nbsp;  0:00.00 migration/0<br>&gt;&nbsp; &nbsp;  4 root&nbsp; &nbsp; &nbsp; 20&nbsp;  0&nbsp; &nbsp;  0&nbsp; &nbsp; 0&nbsp; &nbsp; 0 S&nbsp; 0.0&nbsp; 0.0&nbsp;  0:00.00 ksoftirqd/0<br>&gt; <br>&gt; <br>&gt; Is there a way to cleanup these processes ? OR Do I need to kill them<br>&gt; one by one before respawning the corosync?<br>&gt; <br>&gt; <br>&gt; <br>&gt; _______________________________________________<br>&gt; Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>&gt; <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker"
 target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>&gt; <br>&gt; Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>&gt; Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>&gt; Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br><br><br><br><br>_______________________________________________<br>Pacemaker mailing list: <a ymailto="mailto:Pacemaker@oss.clusterlabs.org" href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br><a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br><br>Project Home: <a
 href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br><br><br></div></div></div></body></html>