AS2500の最果てで

AS2500のどっかのNOCのまとまらないまとめ

Redhat High Availability Addonsで割り当ててたVIPが一定間隔で切れる

rgmanagerでapacheを管理させてたんだけどなんか一定間隔でセッションが切られる感じがあって、wgetとかで接続してると途中でstallする感じがあった。

原因がよくわからなかったしあんまり時間割いてられなかったから放置させてたんだけど、適当に /var/log/messages を眺めてたら、確かにrgmanagerがVIPを設定して1分ぐらいで切ってる感じのログがずっと流れてた。

ログのエントリを眺めてたらどうやらrgmanagerがapacheが走ってるのか上手く見つけられなかったらしい。というのも /var/run/cluster/apache/apache:.pid が見つからんと言ってる。
どうやらpidをそこにあることで動いてることを確認するらしい。

ということで

# ln -s /var/run/httpd.pid /var/run/cluster/apache/apache:<apache-name>.pid

とすることでrgmanagerさんは満足してくれたようだ。

clusvcadm -r も正しく動いてrelocateしてる感じ。
ただ、個人的に気になるのが、

apache殺す
  ↓
VIP切る
  ↓
権限譲渡
  ↓
VIP設定
  ↓
apache起動

という順番で処理が走るせいでかなりのdowntimeが発生してるように見えることだ。
あとapache殺す理由はわかる気がするけど、特にアドレスをバインドする設定もないし殺さんでもなぁ...って気もした。

まぁ動いてるしいいか。


ところでここらへんの挙動ってどっかのドキュメントに書いてないのかなぁ...前ひと通りredhatのオンラインドキュメント漁ったときは見つからなかったんだけど...