Motoharu Kubo
mkubo****@3ware*****
2012年 12月 28日 (金) 14:20:15 JST
久保と申します。 > サーバが1台のみの状態で、crm node standbyを実行したあとに、 > crm node onlineを実行した際に 同様のシチュエーションを作って確認しましたが、standbyを実行するとすべて のリソースが停止し、onlineを実行するとすべてのリソースが正常に起動しました。 > Dec 28 08:59:41 test7a Filesystem(prmFs)[9921]: INFO: Running start for /dev/drbd/by-res/pgsql on /data > Dec 28 08:59:41 test7a Filesystem(prmFs)[9921]: ERROR: Couldn't find device [/dev/drbd/by-res/pgsql]. Expected /dev/??? to exist このエラーは、DRBDの起動が失敗してpgsqlリソースがうまく初期化できなかっ た(さらにプライマリに昇格できなかった)ことを示しています。 > また、standbyにする前は正常に動作していましたし、必ず発生するわけではなく > 一度だけ発生しました。 何度か同じパターンで動かしておられるのなら、/var/log/messagesに表示され るDRBDのログメッセージを比較してみることによって、上記エラーが起きたとき の原因を推測しやすくなるかと思います。 和田さんの環境でスタンバイからオンラインに戻したときの挙動は次のようにな ると考えられます。 スタンバイ状態ではDRBDも動作を停止しています。当然pgsqlリソースも停止し ていて、/dev/drbd/by-res/pgsqlも存在しません。 オンラインに戻した時点でPacemakerはDRBDを起動し、最初にpgsqlリソースはセ カンダリになります。このときに/dev/drbd/by-res/pgsqlが出現します。その後 msリソースが正しく動作すればpgsqlリソースがプライマリに昇格して、 Filesystemリソースがそれをマウントします。 上記のERROR行が表示されたということは、それ以前のDRBDリソースのstart自体 が何らかの理由で失敗していることになるはずで、その理由に関係するDRBDのロ グが/var/log/messagesに表示されているはずです。 > 上述のバージョンのDRBDにおいてこのような不具合はございますでしょうか? > また、考えられる原因はございますでしょうか? 現在の最新レベルのバージョンはたしかに8.4.2ですが、8.3.15の方が枯れてい てお勧めです。DRBD users MLでも8.4系は少しトラブル事例が多い(もちろん 減ってきていますが)ように思います。 8.4系新機能のリソースグループが必須でないならば、8.3系を使う方が安心でき ると思います。 > なお、該当デバイス(シンボリックリンク)の手動での削除は行っていません。 すみませんが、これは具体的にどういうリンクのことなのでしょうか。/dev以下 に何らかのリンクを作っているということでしょうか。それとも別のリンクなの でしょうか。 -- ---------------------------------------------------------------------- 久保 元治 (株)サードウェア Motoharu Kubo 274-0815 千葉県船橋市西習志野3-39-8 mkubo****@3ware***** URL: http://www.3ware.co.jp/ Phone: 047-496-3341 03-4530-0521 (内線201) Fax: 047-496-3370 携帯: 090-6171-5545 GPG fingerprint: D2B0 F02A 4A7F 3FD2 1A66 EF2E F990 D04B 2A83 D477 ★弊社からのメールはZ-Linuxメールフィルタで全数検査しています★ ★ ブログを始めました http://blogs.itmedia.co.jp/ossway/ ★