[Linux-ha-jp] Pacemakerのcloneリソースの動きについて質問

Back to archive index

乾 真聡 masat****@kccs*****
2018年 9月 5日 (水) 17:53:38 JST


高塚様

お世話になっております。乾と申します。

再度スプリットブレイン時の動作を確認し、ログを取得しました。
やはり、apacheの自動起動を無効にすると待機系側を組み込んだ際に、待機系側のapacheリソースがfail状態になります。
ただ、プロセス自体は起動しており、リソース上でfailになっていました。
恐らくstart処理は効いていて、monitor処理で異常が起きているのではないかと思っております。
monitor処理で何を確認しているのかわかっていないのですが、添付のログから何かわかりません
でしょうか?

以上、よろしくお願い致します。


On Wed, 05 Sep 2018 11:31:08 +0900
乾 真聡 <masat****@kccs*****> wrote:

> 高塚様
> 
> 返信いただきありがとうございます。助かります。
> 
> xinetdについてはSSHをxinetd制御としており、sshdが停止したらリソースを対向サーバへ
> 切り替えるという動きとしたかったので入れております。
> 
> xinetdを自動起動にしているのは検証を行っており、最悪ログインできなくなってしまうことを
> 避けたかったためです。
> 可能であれば、chkconfigによる自動起動はしないようにしたいと考えています。
> 
> ログやcrm_mon結果を確認したのですが、なぜfaileになるかわからないといった状況です。
> clone設定したプロセスの自動起動を有効にした場合、運用上なにかデメリットはありますでしょうか?
> 
> 以上、よろしくお願い致します。
> 
> On Wed, 5 Sep 2018 10:28:20 +0900
> TAKATSUKA Haruka <haruk****@sraos*****> wrote:
> 
> > 高塚と申します。
> > 
> > インラインで記載します。
> > 
> > On Wed, 05 Sep 2018 09:41:21 +0900
> > 乾 真聡 <masat****@kccs*****> wrote:
> > 
> > > お世話になっております。
> > > 
> > > 質問させていただいておりますが、いかがでしょうか?
> > > 何かしら反応いただけると幸いです。
> > > 
> > > 以上、よろしくお願い致します。
> > > 
> > > On Fri, 31 Aug 2018 17:46:40 +0900
> > > 乾 真聡 <masat****@kccs*****> wrote:
> > > 
> > > > お世話になっております。
> > > > 
> > > > cloneリソースの動きについて質問させてください。
> > > > Pacemakerリソース設定として以下<リソース設定>を設定しています。
> > > > 
> > > > xinetdとhttpdはclone設定しておりますが、xinetdはchkconfigの自動起動が有効、httpdは無効となっております。
> > > > そこで、以下の手順でスプリットブレインを発生させ、復旧させます。
> > > > 
> > > > <検証手順>
> > > >  ・スプリットブレインを発生(ネットワーク遮断)
> > > >  ・ping_checkの動作により待機系ホストのPacemakerプロセスを停止。稼働系ホストは稼働系として起動し続ける。
> > > >  ・稼働系ホストを停止し、両系停止状態とする。
> > > >  ・ネットワーク復旧
> > > >  ・待機系ホストのPacemakerを起動させる。待機系ホストは稼働系として起動する。
> > > >  ・停止していた元稼働系ホストを起動させる。
> > > > ★・xinetdは両ホストで起動するが、httpdは待機系ホストで起動せず、monitor処理でfailedとなる。
> > > > 
> > > > httpdの自動起動を有効にして上記検証を実施したところ、monitor処理でfailedにならず起動してきました。
> > 
> > 
> > > > <質問内容>
> > > > ★の部分について、cloneリソースの動きについて質問となりますが、httpdが起動していないと、Pacemaker起動タイミングで
> > > > failedとなるのは正しい動きでしょうか?
> > 
> > → ログや crm_mon出力から httpdが起動しなかった理由を調べましょう。
> >    ただし、何であれスプリットブレインが生じた場合からの復帰は手動操作による
> >    対応が必要と考えたほうが良いです。
> > 
> > > > Pacemakerでプロセス起動制御している認識なので自動起動は無効にする必要があるのかと思いましたが、違いますでしょうか?
> > 
> > → 通常そうします。
> >    xinetd を自動起動有効にしたのは、そうしないと OS起動に不都合があった
> >    といったあたりでしょうか。xinetd を Pacemaker管理する事例は私は
> >    みたことがありませんでした。反応がないのは、皆さん同様だったのでは
> >    ないでしょうか。
> > 
> > > > <リソース設定>
> > > > ※IP等はXXXに修正しています
> > > > --------------------------------------------------------------------
> > > > node 1: test-bru-web01 \
> > > >         attributes standby=off
> > > > node 2: test-bru-web02 \
> > > >         attributes standby=off
> > > > primitive EIP EIP \
> > > >         params elastic_ip=XXXXXX allocation_id=XXXXX \
> > > >         op start interval=0s timeout=60s \
> > > >         op monitor interval=30s timeout=30s \
> > > >         op stop interval=0 timeout=60s
> > > > primitive httpd lsb:httpd \
> > > >         op start interval=0s timeout=60s \
> > > >         op monitor interval=30s timeout=30s \
> > > >         op stop interval=0s timeout=60s
> > > > primitive ip-XXX IPaddr \
> > > >         params ip=XXX nic=eth0 cidr_netmask=24 \
> > > >         op monitor interval=30s timeout=30s
> > > > primitive ping_check anything \
> > > >         params binfile="/usr/local/script/pacemaker/ping_check.sh" \
> > > >         op monitor interval=30s timeout=30s on-fail=restart
> > > > primitive replace-route_test-ap lsb:replace-route_test-ap \
> > > >         op monitor interval=30s timeout=30s
> > > > primitive vipcheck VIPcheck \
> > > >         params target_ip=XXX count=3 wait=3 \
> > > >         op start interval=0 timeout=60 on-fail=restart \
> > > >         op stop interval=0 timeout=60 on-fail=ignore \
> > > >         op monitor interval=10 timeout=60 on-fail=restart start-delay=0
> > > > primitive xinetd lsb:xinetd \
> > > >         op start interval=0s timeout=60s \
> > > >         op monitor interval=30s timeout=30s \
> > > >         op stop interval=0s timeout=60s
> > > > group group1 vipcheck ip-XXX replace-route_test-ap EIP
> > > > clone cln_httpd httpd
> > > > clone cln_ping_check ping_check
> > > > clone cln_xinetd xinetd
> > > > location rsc_location group1 \
> > > >         rule 200: #uname eq test-bru-web01 \
> > > >         rule 100: #uname eq test-bru-web02
> > > > colocation rsc_colocation1 inf: group1 cln_xinetd
> > > > colocation rsc_colocation2 inf: group1 cln_httpd
> > > > property cib-bootstrap-options: \
> > > >         have-watchdog=false \
> > > >         dc-version=1.1.16-1.el6-94ff4df \
> > > >         no-quorum-policy=ignore \
> > > >         stonith-enabled=false \
> > > >         have-watchdog=false \
> > > >         cluster-infrastructure=corosync \
> > > >         last-lrm-refresh=1535701464 \
> > > >         maintenance-mode=false
> > > > rsc_defaults rsc-options: \
> > > >         resource-stickiness=INFINITY \
> > > >         migration-threshold=1
> > > > --------------------------------------------------------------------
> > > > 
> > > > 
> > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
> > > >   京セラコミュニケーションシステム株式会社 
> > > >   ITインフラソリューション部
> > > >   東京ITインフラソリューション1B
> > > >        乾 真聡
> > > >       TEL:03-5765-8877 (代表)
> > > >       e-mail:masat****@kccs*****
> > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
> > > 
> > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
> > >   京セラコミュニケーションシステム株式会社 
> > >   ITインフラソリューション部
> > >   東京ITインフラソリューション1B
> > >        乾 真聡
> > >       TEL:03-5765-8877 (代表)
> > >       e-mail:masat****@kccs*****
> > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
> > > 
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux****@lists*****
> > > https://lists.osdn.me/mailman/listinfo/linux-ha-japan
> > > 
> > 
> > ______________________________________________________________________
> >  高塚 遥  haruk****@sraos*****  SRA OSS, Inc. http://www.sraoss.co.jp
> >  〒171-0022 東京都豊島区南池袋2-32-8 
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > https://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 
> ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
>   京セラコミュニケーションシステム株式会社 
>   ITインフラソリューション部
>   東京ITインフラソリューション1B
>        乾 真聡
>       TEL:03-5765-8877 (代表)
>       e-mail:masat****@kccs*****
> ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏

┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
  京セラコミュニケーションシステム株式会社 
  ITインフラソリューション部
  東京ITインフラソリューション1B
       乾 真聡
      TEL:03-5765-8877 (代表)
      e-mail:masat****@kccs*****
┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: crm_mon.txt
型:         application/octet-stream
サイズ:     1094 バイト
説明:       無し
URL:        https://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20180905/f479cb50/attachment-0002.obj 
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: pacemaker.log
型:         application/octet-stream
サイズ:     98885 バイト
説明:       無し
URL:        https://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20180905/f479cb50/attachment-0003.obj 



Linux-ha-japan メーリングリストの案内
Back to archive index