Redhat High Availability Addonsで割り当ててたVIPが一定間隔で切れる
rgmanagerでapacheを管理させてたんだけどなんか一定間隔でセッションが切られる感じがあって、wgetとかで接続してると途中でstallする感じがあった。
原因がよくわからなかったしあんまり時間割いてられなかったから放置させてたんだけど、適当に /var/log/messages を眺めてたら、確かにrgmanagerがVIPを設定して1分ぐらいで切ってる感じのログがずっと流れてた。
ログのエントリを眺めてたらどうやらrgmanagerがapacheが走ってるのか上手く見つけられなかったらしい。というのも /var/run/cluster/apache/apache:
どうやらpidをそこにあることで動いてることを確認するらしい。
ということで
# ln -s /var/run/httpd.pid /var/run/cluster/apache/apache:<apache-name>.pid
とすることでrgmanagerさんは満足してくれたようだ。
clusvcadm -r
ただ、個人的に気になるのが、
apache殺す ↓ VIP切る ↓ 権限譲渡 ↓ VIP設定 ↓ apache起動
という順番で処理が走るせいでかなりのdowntimeが発生してるように見えることだ。
あとapache殺す理由はわかる気がするけど、特にアドレスをバインドする設定もないし殺さんでもなぁ...って気もした。
まぁ動いてるしいいか。
ところでここらへんの挙動ってどっかのドキュメントに書いてないのかなぁ...前ひと通りredhatのオンラインドキュメント漁ったときは見つからなかったんだけど...