<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 12pt;
font-family:Calibri
}
--></style></head>
<body class='hmmessage'><div dir='ltr'><div><div>These are the libqb versions:</div><div><br></div><div>libqb-devel-0.14.2-3.el6.x86_64</div><div>libqb-0.14.2-3.el6.x86_64</div><div><br></div><div>Here is a process listing where lrmd is running:</div><div>[root@node1 ~]# ps auxwww | egrep "heartbeat|pacemaker"</div><div>root &nbsp; &nbsp; &nbsp;9553 &nbsp;0.1 &nbsp;0.7 &nbsp;52420 &nbsp;7424 ? &nbsp; &nbsp; &nbsp; &nbsp;SLs &nbsp;May14 &nbsp; 1:39 heartbeat: master control process</div><div>root &nbsp; &nbsp; &nbsp;9556 &nbsp;0.0 &nbsp;0.7 &nbsp;52260 &nbsp;7264 ? &nbsp; &nbsp; &nbsp; &nbsp;SL &nbsp; May14 &nbsp; 0:10 heartbeat: FIFO reader</div><div>root &nbsp; &nbsp; &nbsp;9557 &nbsp;0.0 &nbsp;0.7 &nbsp;52256 &nbsp;7260 ? &nbsp; &nbsp; &nbsp; &nbsp;SL &nbsp; May14 &nbsp; 1:01 heartbeat: write: mcast eth0</div><div>root &nbsp; &nbsp; &nbsp;9558 &nbsp;0.0 &nbsp;0.7 &nbsp;52256 &nbsp;7260 ? &nbsp; &nbsp; &nbsp; &nbsp;SL &nbsp; May14 &nbsp; 0:14 heartbeat: read: mcast eth0</div><div>root &nbsp; &nbsp; &nbsp;9559 &nbsp;0.0 &nbsp;0.7 &nbsp;52256 &nbsp;7260 ? &nbsp; &nbsp; &nbsp; &nbsp;SL &nbsp; May14 &nbsp; 0:23 heartbeat: write: bcast eth1</div><div>root &nbsp; &nbsp; &nbsp;9560 &nbsp;0.0 &nbsp;0.7 &nbsp;52256 &nbsp;7260 ? &nbsp; &nbsp; &nbsp; &nbsp;SL &nbsp; May14 &nbsp; 0:13 heartbeat: read: bcast eth1</div><div>498 &nbsp; &nbsp; &nbsp; 9563 &nbsp;0.0 &nbsp;0.2 &nbsp;36908 &nbsp;2392 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;May14 &nbsp; 0:10 /usr/lib64/heartbeat/ccm</div><div>498 &nbsp; &nbsp; &nbsp; 9564 &nbsp;0.0 &nbsp;1.0 &nbsp;85084 10704 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;May14 &nbsp; 0:25 /usr/lib64/heartbeat/cib</div><div>root &nbsp; &nbsp; &nbsp;9565 &nbsp;0.0 &nbsp;0.1 &nbsp;44588 &nbsp;1896 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;May14 &nbsp; 0:04 /usr/lib64/heartbeat/lrmd -r</div><div>root &nbsp; &nbsp; &nbsp;9566 &nbsp;0.0 &nbsp;0.3 &nbsp;83544 &nbsp;3988 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;May14 &nbsp; 0:10 /usr/lib64/heartbeat/stonithd</div><div>498 &nbsp; &nbsp; &nbsp; 9567 &nbsp;0.0 &nbsp;0.3 &nbsp;78668 &nbsp;3248 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;May14 &nbsp; 0:10 /usr/lib64/heartbeat/attrd</div><div>498 &nbsp; &nbsp; &nbsp;26534 &nbsp;0.0 &nbsp;0.3 &nbsp;92364 &nbsp;3748 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;16:05 &nbsp; 0:00 /usr/lib64/heartbeat/crmd</div><div>498 &nbsp; &nbsp; &nbsp;26535 &nbsp;0.0 &nbsp;0.2 &nbsp;72840 &nbsp;2708 ? &nbsp; &nbsp; &nbsp; &nbsp;S &nbsp; &nbsp;16:05 &nbsp; 0:00 /usr/libexec/pacemaker/pengine</div><div><br></div><div><br></div><div>Here are the logs at startup until the "Failed to sign on" message just starts to repeat over and over:</div><div>May 15 16:07:06 node1 crmd[26621]: &nbsp; notice: main: CRM Git Version: b060cae</div><div>May 15 16:07:06 node1 attrd[26620]: &nbsp; notice: crm_cluster_connect: Connecting to cluster infrastructure: heartbeat</div><div>May 15 16:07:06 node1 attrd[26620]: &nbsp; notice: main: Starting mainloop...</div><div>May 15 16:07:06 node1 stonith-ng[26619]: &nbsp; notice: crm_cluster_connect: Connecting to cluster infrastructure: heartbeat</div><div>May 15 16:07:06 node1 cib[26617]: &nbsp; notice: crm_cluster_connect: Connecting to cluster infrastructure: heartbeat</div><div>May 15 16:07:06 node1 lrmd: [26618]: WARN: Initializing connection to logging daemon failed. Logging daemon may not be running</div><div>May 15 16:07:06 node1 lrmd: [26618]: info: max-children set to 4 (1 processors online)</div><div>May 15 16:07:06 node1 lrmd: [26618]: info: enabling coredumps</div><div>May 15 16:07:06 node1 lrmd: [26618]: info: Started.</div><div>May 15 16:07:06 node1 cib[26617]: &nbsp;warning: ccm_connect: CCM Activation failed</div><div>May 15 16:07:06 node1 cib[26617]: &nbsp;warning: ccm_connect: CCM Connection failed 1 times (30 max)</div><div>May 15 16:07:06 node1 ccm: [26616]: WARN: Initializing connection to logging daemon failed. Logging daemon may not be running</div><div>May 15 16:07:06 node1 ccm: [26616]: info: Hostname: node1</div><div>May 15 16:07:07 node1 crmd[26621]: &nbsp;warning: do_cib_control: Couldn't complete CIB registration 1 times... pause and retry</div><div>May 15 16:07:09 node1 cib[26617]: &nbsp;warning: ccm_connect: CCM Activation failed</div><div>May 15 16:07:09 node1 cib[26617]: &nbsp;warning: ccm_connect: CCM Connection failed 2 times (30 max)</div><div>May 15 16:07:10 node1 crmd[26621]: &nbsp;warning: do_cib_control: Couldn't complete CIB registration 2 times... pause and retry</div><div>May 15 16:07:13 node1 crmd[26621]: &nbsp; notice: crm_cluster_connect: Connecting to cluster infrastructure: heartbeat</div><div>May 15 16:07:14 node1 cib[26617]: &nbsp; notice: crm_update_peer_state: crm_update_ccm_node: Node node2[1] - state is now member (was (null))</div><div>May 15 16:07:14 node1 cib[26617]: &nbsp; notice: crm_update_peer_state: crm_update_ccm_node: Node node1[0] - state is now member (was (null))</div><div>May 15 16:07:15 node1 crmd[26621]: &nbsp;warning: do_lrm_control: Failed to sign on to the LRM 1 (30 max) times</div><div><br></div><div>Here is the repeating message peices:</div><div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: do_lrm_control: Failed to sign on to the LRM 30 (max) times</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: do_log: FSA: Input I_ERROR from do_lrm_control() received in state S_STARTING</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp;warning: do_state_transition: State transition S_STARTING -&gt; S_RECOVERY [ input=I_ERROR cause=C_FSA</div><div>_INTERNAL origin=do_lrm_control ]</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp;warning: do_recover: Fast-tracking shutdown in response to errors</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: do_started: Start cancelled... S_RECOVERY</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: do_log: FSA: Input I_TERMINATE from do_recover() received in state S_RECOVERY</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; notice: do_lrm_control: Disconnected from the LRM</div><div>May 15 16:06:09 node1 ccm: [9563]: info: client (pid=26534) removed from ccm</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: do_exit: Could not recover from internal error</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: crm_abort: crm_glib_handler: Forked child 26540 to record non-fatal assert at logging.c:63</div><div>&nbsp;: g_hash_table_size: assertion `hash_table != NULL' failed</div><div>May 15 16:06:09 node1 crmd[26534]: &nbsp; &nbsp;error: crm_abort: crm_glib_handler: Forked child 26541 to record non-fatal assert at logging.c:63</div><div>&nbsp;: g_hash_table_destroy: assertion `hash_table != NULL' failed</div><div>May 15 16:06:09 node1 crmd[26542]: &nbsp; notice: main: CRM Git Version: b060cae</div><div>May 15 16:06:09 node1 crmd[26542]: &nbsp; notice: crm_cluster_connect: Connecting to cluster infrastructure: heartbeat</div><div>May 15 16:06:10 node1 crmd[26542]: &nbsp;warning: do_lrm_control: Failed to sign on to the LRM 1 (30 max) times</div><div>May 15 16:06:10 node1 crmd[26542]: &nbsp; notice: crmd_client_status_callback: Status update: Client node1/crmd now has status [join] (DC=false)</div><div>May 15 16:06:10 node1 crmd[26542]: &nbsp; notice: crmd_client_status_callback: Status update: Client node1/crmd now has status [online] (DC=false)</div><div>May 15 16:06:10 node1 crmd[26542]: &nbsp; notice: crmd_client_status_callback: Status update: Client node2/crmd now has status [online] (DC=false)</div><div>May 15 16:06:11 node1 crmd[26542]: &nbsp;warning: do_lrm_control: Failed to sign on to the LRM 2 (30 max) times</div><div>May 15 16:06:12 node1 crmd[26542]: &nbsp;warning: do_lrm_control: Failed to sign on to the LRM 3 (30 max) times</div></div></div>                                               </div></body>
</html>