2017年6月30日金曜日

pacemaker を入れよう

というわけで、HA クラスタソフトを入れる。
とは言え、ドレがいいのか分からないので、ここでは定番とも言える pacemaker にしよう。
対象は gemini / cancer だ。
$ sudo apt-get update
$ sudo apt-get --simulate install pacemaker
$ sudo apt-get install pacemaker

インストールが終わったら起動してみる。(基本設定してないけど…。)
(gemini) $ sudo systemctl start pacemaker
(gemini) $ systemctl --no-pager -l status pacemaker
Stonith 関係のエラーが出てる。

(gemini) $ ps -ef | grep pacemaker | grep -v grep
起動はしているようだ。

cancer も…。
(cancer) $ sudo systemctl start pacemaker
(cancer) $ systemctl --no-pager -l status pacemaker
あれ?Stonith 関連のエラーは出てこなかった…。

(cancer) $ ps -ef | grep pacemaker | grep -v grep
こちらも、起動はしているようだ。

pacemaker は、crm というコマンドを通して操作を行うようだ。
まずはステータスを見てみよう。
$ sudo crm status --verbose
どうやら、過去に構築した corosync を通して、ノード間の通信と Online 状態であることは確認できているみたいだ。
ただ、STONITHリソースが定義出来ていないので、他のリソースが起動できないよ、という警告が。っても、何のリソースも定義していないのだが…。

この後、Stonith を含む基本設定を施すことになるのだが、設定を施す前に、今どのような設定になっているかを確認しておこう。
クラスタ全体の Property 一覧は、crm の configure show_property で出力出来る。
$ sudo crm configure show_property
ただコレは、設定可能な項目の一覧なので、各項目にどのような値が設定されているか分からない。
設定されている値は、先程のコマンドの後ろに、設定項目名を入れると分かる。
例えば…
$ sudo crm configure show_property stop-orphan-resources
true
この stop-orphan-resouces というパラメータは、true が設定されている、ということだ。
一度、全部洗い出しておこう。
#項目名備考
1stop-orphan-resourcestrue
2dc-deadtime20s
3placement-strategydefault
4symmetric-clustertrue
5maintenance-modefalse
6default-action-timeout20s
7node-health-yellow0
8start-failure-is-fataltrue
9shutdown-escalation20min
10stop-all-resourcesfalse
11no-quorum-policystop
12dc-version1.1.14-70404b0
13startup-fencingtrue
14stonith-enabledtrue
15pe-input-series-max4000
16stonith-actionreboot
17pe-error-series-max-1
18is-managed-defaulttrue
19node-health-red-INFINITY
20remove-after-stopfalse
21crmd-transition-delay0s
22election-timeout2min
23node-health-green0
24node-action-limit0
25stonith-timeout60s
26enable-aclfalse
27batch-limit0
28pe-warn-series-max5000
29enable-startup-probestrue
30stop-orphan-actionstrue
31default-resource-stickiness0
32cluster-recheck-interval15min
33cluster-infrastructurecorosync
34crmd-integration-timeout3min
35stonith-watchdog-timeout(null)
36crmd-finalization-timeout30min
37have-watchdogfalse
38migration-limit-1
39load-threshold80%
40node-health-strategynone
41cluster-delay60s

デフォルト値が分かったが、どの値が何を意味しているのか分からない。
おいおい調査していくことにしよう。

逆に言うと、何をどう設定すれば何が起きるのか分からない。
なので、今はデフォルトのママにして、必要に応じて修正していくことにする。

次回は、ゲストOS(leo) をクラスタサービスにしてみる。(出来るのか?)

0 件のコメント:

コメントを投稿