[サーバ]Nagiosで遊ぶ
Nagiosというサービス監視ソフトウェアで遊んでます。こいつは、サーバ等で稼動しているサービス(デーモン)ソフトウェアを監視するソフトです。万が一サービスが何らかの理由で停止したり、アクセスができなくなった場合は、管理者へ警告のメールが送られると言う優れもの。こういったソフトウェアが無料で使えるとは、開発者の方々には感謝感謝です。
それで、うちでは最新版で現在開発中のNagios 3.0を使おうとしてみました。
んが、なぜかNagiosデーモンが起動をしたとたんCPUを100%食いつぶし始め、挙句の果てには終了命令も受け付けない始末……
結局強制終了させて終了させるしかなかったのですが、これの原因が分からず挫折orz
安定版の2.10をインストールしましたとさ。
さすが安定版、さくっと設定してさくっと動作しました。
今のところlocalhostしか監視対象にしてませんが、監視対象を拡大したらかっこよくなりそう。
そういえば、サービスが停止した場合管理者へメールを出してくれるわけですが、ここでもまた問題が。
実験のためにHTTPサービスを止めて、いざメールかもーん!と待っていたのはいいのですが、待てど暮らせどメールがやってこず。
痺れを切らして、HTTPサービスを復活させて状態を見ると、一応メールは出してる様子。でもエラーになってるっぽい感じ。
んで設定ファイルをよーく眺めて見ると下のような記述が:
# SAMPLE NOTIFICATION COMMANDS
#
# These are some example notification commands. They may or may not work on
# your system without modification. As an example, some systems will require
# you to use "/usr/bin/mailx" instead of "/usr/bin/mail" in the commands below.
あらあらまぁまぁ……
設定ファイルをよく読めってことですなw
とりあえず、関連する項目を正しいものに変更してもう一度テストをするとちゃんと
** PROBLEM alert - localhost/HTTP is CRITICAL **
***** Nagios 2.10 *****
Notification Type: PROBLEM
Service: HTTP
Host: localhost
Address: 127.0.0.1
State: CRITICALDate/Time: Tue Dec 18 23:15:06 JST 2007
Additional Info:
Connection refused
のようにメールが届くわけです。
なかなか楽しいですし、見ててカッコいいと思うのはアレなんでしょうか……
最新版も早く安定版に移行してくれるといいなぁ……
[サーバ]がんばるサーバ君
10:28PM up 371 days, 8:05, 1 user, load averages: 0.00, 0.00, 0.00
電源入れてからの時間が1年を超えました.
この間特に問題も無く,セキュリティホールに関する更新も再起動が要するものは無かったので,サーバ本体やサーバに使っているソフトウェアの開発者の方々には感謝感謝です.
多分今後も特に問題が発生しなければ,このまま稼動し続けると思います.
どこまで記録が続くのやら……
[サーバ]メンテナンス完了のお知らせ
前回,ネットワークメンテナンスの告知を行っていましたが作業が完了したことをお知らせします.
こちらの方では問題は確認されていませんが,何か問題がありましたら連絡をいただければと思います.
[サーバ]メンテナンス延期のお知らせ
こちらでお伝えしていたメンテナンスですが,プロバイダの準備が整わないため,整い次第メンテナンス突入とします.
真に申し訳ございませんが,ご協力の方をお願いします.
