HACMP認(rèn)證知識(shí):應(yīng)用程序監(jiān)視
除了資源組管理以外,HACMP 還可以通過以下兩種方法之一監(jiān)視應(yīng)用程序:
應(yīng)用程序進(jìn)程監(jiān)視:使用 RSCT 事件管理功能檢測(cè)進(jìn)程是否終止。
應(yīng)用程序自定義監(jiān)視:基于您定義的監(jiān)視方法(程序或腳本)來監(jiān)視應(yīng)用程序的運(yùn)行狀況。
注意:不能將應(yīng)用程序進(jìn)程監(jiān)視用于監(jiān)視通過 Shell 腳本啟動(dòng)的應(yīng)用程序,或那些監(jiān)視進(jìn)程無法確定應(yīng)用程序運(yùn)行狀況的應(yīng)用程序。
對(duì)于監(jiān)視 Shell 腳本應(yīng)用程序,必須使用自定義監(jiān)視方法(例如,Apache Web 服務(wù)器)。
當(dāng)應(yīng)用程序監(jiān)視處于活動(dòng)狀態(tài)時(shí),HACMP 的行為如下:
對(duì)于應(yīng)用程序進(jìn)程監(jiān)視,一個(gè)內(nèi)核 hook 將通知 HACMP 集群管理器所監(jiān)視的進(jìn)程已終止,HACMP 將啟動(dòng)應(yīng)用程序恢復(fù)過程。
要使恢復(fù)操作能夠進(jìn)行,必須提供某種方法來清理和重新啟動(dòng)應(yīng)用程序(可以使用為應(yīng)用程序服務(wù)器定義提供的應(yīng)用程序啟動(dòng)/停止腳本)。
HACMP 嘗試重新啟動(dòng)應(yīng)用程序,并等待應(yīng)用程序穩(wěn)定指定的時(shí)間,然后發(fā)送通知消息和/或?qū)嶋H將整個(gè) RG 移動(dòng)到另一個(gè)節(jié)點(diǎn)(節(jié)點(diǎn)優(yōu)先級(jí)列表中的下一個(gè)節(jié)點(diǎn))。
對(duì)于自定義應(yīng)用程序監(jiān)視(自定義方法),除了應(yīng)用程序清理和重新啟動(dòng)方法以外,還必須提供用于執(zhí)行定期應(yīng)用程序測(cè)試的程序/腳本。
要規(guī)劃進(jìn)程監(jiān)視器的配置,請(qǐng)檢查以下事項(xiàng):
驗(yàn)證該應(yīng)用程序是否可以使用某個(gè)進(jìn)程監(jiān)視器進(jìn)行監(jiān)視。
檢查要監(jiān)視的進(jìn)程的名稱。必須使用準(zhǔn)確的進(jìn)程名稱來配置應(yīng)用程序監(jiān)視器。
指定擁有進(jìn)程的用戶名,例如 root。請(qǐng)注意,該進(jìn)程擁有者必須擁有要監(jiān)視的所有進(jìn)程。
指定要監(jiān)視的應(yīng)用程序的.實(shí)例數(shù)量(進(jìn)程數(shù)量)。缺省為一個(gè)實(shí)例。
指定在開始監(jiān)視前的等待時(shí)間(以秒為單位)。
注意:在大多數(shù)情況下,此值不應(yīng)該為零。例如,對(duì)于數(shù)據(jù)庫應(yīng)用程序,您可能希望將監(jiān)視延遲到啟動(dòng)腳本和初始數(shù)據(jù)庫搜索已完成之后。
重新啟動(dòng)數(shù)值,表示在采取任何其他操作之前嘗試重新啟動(dòng)應(yīng)用程序的次數(shù)。
在重置重新啟動(dòng)數(shù)值前應(yīng)用程序必須保持穩(wěn)定的間隔(以秒為單位)。
要在應(yīng)用程序無法在重新啟動(dòng)數(shù)值內(nèi)重新啟動(dòng)時(shí)采取的操作。缺省選擇是通知,即運(yùn)行一個(gè)事件來向集群通知故障情況。還可以指定故障轉(zhuǎn)移,在此情況下,包含故障應(yīng)用程序的資源組將移動(dòng)到對(duì)該資源組擁有下一個(gè)最高優(yōu)先級(jí)的集群節(jié)點(diǎn)。
重新啟動(dòng)方法(如果希望的話)。(如果“Restart Count”不為零,則這是必需的。)
如果計(jì)劃建立自定義監(jiān)視方法,則還要檢查:
是否已指定了要用于檢查指定應(yīng)用程序的程序/腳本。
關(guān)于運(yùn)行該監(jiān)視方法的頻度的輪詢間隔(以秒為單位)。如果監(jiān)視器在此間隔內(nèi)沒有響應(yīng),則認(rèn)為應(yīng)用程序出錯(cuò),并啟動(dòng)恢復(fù)過程。
在用戶定義的監(jiān)視方法未在輪詢間隔內(nèi)返回時(shí)用于終止該監(jiān)視器方法的信號(hào)。缺省信號(hào)為 SIGKILL。
開始監(jiān)視前的等待時(shí)間(以秒為單位)。例如,對(duì)于數(shù)據(jù)庫應(yīng)用程序,建議將監(jiān)視延遲到啟動(dòng)腳本和初始數(shù)據(jù)庫搜索已完成之后(否則,可能會(huì)認(rèn)為應(yīng)用程序出錯(cuò)并啟動(dòng)恢復(fù)過程)。
重新啟動(dòng)數(shù)值,即在采取任何其他操作之前嘗試重新啟動(dòng)應(yīng)用程序的次數(shù)。
在重置重新啟動(dòng)數(shù)值前應(yīng)用程序必須保持穩(wěn)定的間隔(以秒為單位)。
在應(yīng)用程序無法在重新啟動(dòng)數(shù)值內(nèi)重新啟動(dòng)時(shí)采取的操作。
【HACMP認(rèn)證知識(shí):應(yīng)用程序監(jiān)視】相關(guān)文章:
HACMP認(rèn)證知識(shí):應(yīng)用程序兼容性10-13
IBM的HACMP認(rèn)證知識(shí):HACMP的規(guī)劃10-13
HACMP認(rèn)證學(xué)習(xí)系列知識(shí)06-14
IBM認(rèn)證知識(shí):HACMP術(shù)語10-13
HACMP認(rèn)證知識(shí)點(diǎn)10-08
HACMP認(rèn)證知識(shí):災(zāi)難恢復(fù)計(jì)劃10-13
HACMP認(rèn)證知識(shí):資源組類型10-13