[Linux-ha-jp] スプリットブレイン時の回復方法

Back to archive index

mlus mlus****@39596*****
2014年 1月 24日 (金) 14:45:15 JST


コヤマです。

> VIPcheckはpm_extrasというパッケージに含まれます。
> pm_extras-2.0-1.el6.x86_64.rpm

pm_extras-2.0-1.el6.x86_64.rpm をダウンロードして、試してみました。

x86_64 なので、どうしたもんか・・・と 考え、以下のようにしました

VIPcheckファイルのみを リソースとしてコピーする

$ rpm2cipio pm_extras-2.0-1.el6.x86_64.rpm | cipio -id
# cp /usr/lib/ocf/resource.d/heartbeat/VIPcheck
/usr/lib/ocf/resource.d/heartbeat/

start の timeout の設定だけだと、何かと文句を言われるので、stopも同じように90sでセットしてやるとおとなしくしてくれた。

primitive v_check ocf:heartbeat:VIPcheck \
  params target_ip="192.168.1.90" count="1" wait="10" \
  op start start-delay="4s" timeout="90s" on-fail="restart" \
  op stop timeout="90s"

host1のインターコネクト接続nicを ifdown させてみた所、無事に host2のみで
仮想アドレスが起動し、期待通りにhost1の方は仮想アドレスは作られていませんでした。感謝!

その後、host1のインターコネクトNICをifupした後で、host2のHAを 停止・起動 させる事で、再びhost1にて仮想アドレスが稼動しました。

----------------------------------------------------------
Last updated: Fri Jan 24 13:44:34 2014
Last change: Fri Jan 24 13:37:31 2014 by hacluster via crmd on host1
Stack: corosync
Current DC: host1 (2886926337) - partition with quorum
Version: 1.1.10-1.2-d9bb763
3 Nodes configured
6 Resources configured


Online: [ host2 host1 ]
OFFLINE: [ host1 ]

Full list of resources:

 Resource Group: grp
     v_check    (ocf::heartbeat:VIPcheck):      Started host1
     v_ip       (ocf::heartbeat:IPaddr2):       Started host1
     failmail   (ocf::heartbeat:MailTo):        Started host1
 Clone Set: clone_v_ping [v_ping]
     Started: [ host2 host1 ]

Node Attributes:
* Node host2:
    + pingcheck                         : 100
* Node host1:
    + pingcheck                         : 100

Migration summary:* Node host2: * Node host1:
---------------------------------------------------------------------------


あいかわらず、

Online: [ host2 host1 ]
OFFLINE: [ host1 ]  <----  これが気になる
^^^^^^^^^^^^^^^^^^^^^^^^

の 表示は出ていますが、動作自体は何の問題もありません。

ヒバリさん、ヒガシさん  おかげさまで大変助かりました。 いろいろありがとうございました。





Linux-ha-japan メーリングリストの案内
Back to archive index