他のサーバ/サービスはZabbixが見てくれるが、zabbix-serverのプロセス自体はどうするのよ、という所でmonitを入れた。
monit公式:http://mmonit.com/monit/
monitのやり方はいい、少し監視について話します。
シンプルにシステム監視運用を
一般にシステム監視は大体下記のような流れで行われています。
- 常態監視システムがサービスが停止しているのを検知
- 運用担当者にアラート
- 運用担当者がサービスの状態確認
- サービスが停止していることを確認
- 手動でサービスを起動
- 常態監視システムから復帰の通知
さて、ここには削れる要素が沢山ありますが、どこでしょうか。
そう、2-5の手順は不要ですよね。
結局、有人の対応が必要なケースはまず無い(ようにする)ため、基本はこれでよいのです。
- 常態監視システムがサービスが停止しているのを検知
- 自動で起動
- 常態監視システムからサービス自動再開の通知
monitやDeamontoolsのツールはこういったシンプル運用の色が強いツールで、とりわけmonitは既存のソフト構成にはほぼ影響がないところが気に入っています。
もちろんnagiosでもzabbixの運用監視ツールでも自動再開は可能です。
nagios達はあくまで状態の変化を検知して、その後の対応は如何様にでもご自由にというツールですからね。
まあメールにする人が多いと思いますけど。
monitのセットアップ
この後Monitのセットアップについても書こうと思ったら、ちょうどよいものがあったのでリンクにしました。
サービス監視ユーティリティ「Monit」 >> guro_chanの日記
公式にはない、Upstartからのrespawn方法があって素晴らしい。
まとめ
ツールと通知のバランスをとって、ただの状態変化に踊らされない運用監視をしましょう。
常態はあるていど自動で保てます。
0 件のコメント:
コメントを投稿