システムを安定して稼働させたいと考えた際、行わなければならないものとしてシステム監視があります。ただ、これからシステム監視に取り組む予定であるものの、概要や何を行えば良いのかがわからないといった方もいるはずです。
そこで、新規にシステム監視を始めたいと考えている方のため、確認しておきたい基本と監視を行う目的、どのような種類・監視項目があるのかなどを解説します。
この記事を読むことによってシステム監視開始前に確認しておきたいことがわかるようになるので、ぜひ参考にしてみてください。
目次
システム監視とは
そもそもシステム監視とは何かから解説します。システム監視とは、システム内で動作するサーバーのほか、アプリケーション、ネットワークといったものが正しく稼働しているかを確認する作業です。
現在は多くの企業で各種システムを活用しており、それがなければ業務が滞ったり、問題になったりすることも珍しくありません。仮に適切にシステム監視が行えず、ITシステム全体が止まってしまったような場合は、大きな損失につながることもあります。
このような事態を避けるため、多くの企業において必要となるのがシステム監視です。何かトラブルが起こりそうな場合はそれらをできるだけ早く察知することにもつながります。
問題が起こりそうな場合や、すでに問題が起こっている場合はシステム管理者に通知されます。
【関連記事】:データベースの監視項目と監視をするメリット・デメリットについて
システム監視の目的
システム監視を行う主な目的は、サービスが正しく稼働しているか確認すること、障害を予防することの2つです。それぞれ解説していきます。
サービスが正しく稼働しているか確認する
自社で提供しているサービスが正しく稼働しているか確認する目的があります。
例えばECサイトを運営する場合、商品を購入しようにもカートに商品が追加されない、決済画面に移行しないといったトラブルが発生すれば、販売機会を逃してしまいます。
エンドユーザーに対して不満を抱かせることにもなるので、場合によっては顧客離れにもつながってしまう大きなトラブルです。
このようなトラブルが起こっていることにいち早く気づければ良いのですが、気づくのが遅れてしまうと対応が遅れ、大幅な損失につながってしまうこともあります。
こういったことがないようにサービスの稼働状況を確認するのがシステム監視の大きな目的です。
障害を予防する
すでに発生している障害を見つけることも目的ではありますが、その障害が発生する前に予防することも目的です。
例えば、継続して監視を行っていくと、ハードウェアの故障につながるような兆候が見えてくることもあります。こういった場合は、故障する前にハードウェアを交換することで大規模な障害を予防することが可能です。
障害を予防することは、エンドユーザーに対して自社のサービスを快適な状態で届けることにもなります。
また、普段からシステム監視を行っておくと、万が一、障害が起こってしまった場合も原因となっている箇所を見つけやすくなるため、早急な復旧につなげることも可能です。
システム監視の種類と項目
システム監視は、インフラ監視とサービス監視の2つに分かれます。それぞれの特徴と各監視で該当する項目を解説します。
インフラ監視
インフラ監視とは、ITインフラに関するものを監視することをいいます。
例えば、サーバー機器やネットワーク機器、OS、ミドルウェア、ルーター、通信回線などです。ITインフラに何らかの障害が起こってしまった場合は、大規模障害につながってしまうことも少なくありません。
そのため、特に重要な監視といえます。インフラ監視では、主に以下の5つの監視が必要です。
死活監視
サーバーが停止しているか、していないかの監視が死活監視です。pingを利用する形でサーバーに対してリクエストを送り、正しく稼働しているか判別を行います。
応答がなかった場合は対象機器または経路のネットワークに問題が起こっているため、早急に対応が必要です。
リソース監視
リソースCPUやメモリ、ネットワーク、ストレージといったサーバーを構成しているハードウェアの動作状況に関する監視です。動作自体に問題がなかったとしても高負荷状況が続いている場合は障害につながる恐れがあるため、対策しなければなりません。
リソース監視を行うことにより、ハードウェアが故障する兆候を見つけることも可能です。障害を予防するためにも重要なポイントになります。
ログ監視
ハードウェアやソフトウェアの動作記録であるログを監視するのが、ログ監視です。システムが正常に稼働しているかわかります。また、トラブルやエラーが発生した際の記録も確認可能です。
SNMP監視
SNMPとはプロトコルの一つです。ネットワーク機器の動作状況のほかは、トラフィック、サーバーのパフォーマンスといったものを確認するのがSNMP監視です。
パブリッククラウド監視
パブリッククラウドとは、不特定多数が共同で利用可能なクラウドサービスのことをいいます。代表的なものとして、AWSやGoogle Cloudなどが挙げられます。
これらのクラウドで稼働しているシステムの分析・管理を行うのがパブリッククラウド監視です。
サービス監視
サービス監視とは、サーバー上で提供しているプログラムに異常がないかを監視することをいいます。そのサービスを利用するユーザーがストレスを感じることなく利用できているのかなども監視対象です。
プロセス監視と外形監視の2種類があります。
プロセス監視
プロセス監視とは、サーバー上で実行しているアプリケーションやデータベースといったものの動作が正しく行われているか監視することをいいます。
プロセス監視を行うことにより、何らかの障害が発生した際に問題のあるプロセスをいち早く特定することも可能です。
外形監視
外形監視とは、サービスを利用するユーザーと同様の方法でアクセスした際に正常に動作するか確認するための監視です。
例えば、画面が正しく表示されていない、表示に時間がかかるといったトラブルがないか確認します。提供しているサービスを快適に利用してもらうためにも重要なポイントです。
システム監視項目の洗い出し方
システム監視をする場合、どのような項目を監視対象にするのか明確にしておかなければなりません。
総合的にすべてを監視対象とすることも可能です。ですが、それだけ監視の負担が増えてしまうため、本当に必要なものを洗い出すことをおすすめします。
はじめに監視する対象を考えることになります。次に、その対象が正常に稼働するために必要な監視項目を考えなければなりません。
例えば、ECサイトを対象とする場合は、そのECサイトで買い物をするにあたり、必要な機能全般が監視項目となります。一例としては以下のようなものです。
【必要な監視項目】
- 会員登録や退会、会員情報の変更などができるか
- 商品をカートに入れたり削除したりできるか
- 商品の検索やお気に入り登録ができるか
- カートに入れた商品を問題なく購入できるか
また、ECサイトを運用する以上インフラ監視も必要です。何を行うために監視するのかを考えると必要となる監視項目も見えてきます。
システム監視の注意点
システム監視を行う際、注意しておきたいポイントがいます。特におさえておきたいのが、人員の確保とマニュアルが必要になることです。それぞれ解説します。
人員を確保する必要がある
システム監視を行うためには、監視に関する専門的な知識を持った人員を確保しなければなりません。監視項目が多ければ多いほど、たくさんの人が必要になります。
例えば、エンドユーザーが利用できる時間体が限定されているサービスであれば、その時間帯のみ監視することも可能です。ですが、24時間提供するサービスの場合は、常に誰かが監視している体制を整えておく必要があります。
そのための人員を確保するためにはそのためのコストも必要ですし、場合によっては採用活動も行わなければなりません。
マニュアルが不可欠
システム監視の進め方や、ツールの操作方法、万が一障害が発生してしまった際の対応などはマニュアルにまとめておく必要があります。マニュアルがなければ具体的にどういった作業をすれば良いかがわからないだけではなく、障害発生時の対応が遅れてしまう可能性も高いです。
マニュアルは、平常時に行うべき内容をまとめたものと、障害発生時に対処法を確認するためのものを両方用意しておくことが大切です。
過去に発生した障害は再度発生する可能性もあるため、発生した障害の内容を書き加えるなどしてマニュアルをアップデートしていくことが求められます。
システム監視ツールの利用がおすすめ
システム監視は24時間体制で人員を確保し、人の手・目で行うことも可能です。ですが、システム監視ツールの導入をおすすめします。
システム監視ツールを導入することにより、監視のために必要な人員の人数を抑えることが可能です。24時間365日休むことなくシステム管理を人が行うのはなかなか現実的ではありません。
監視ツールで行えば、夜中など監視人員を確保するのが難しい時間帯でも対応可能です。
また、設定されたコマンドを自動的に繰り返し行えるので、コマンドを実行のたびに人が作業する必要はありません。何か障害が発生した際にも強いです。
異常が起こった場合は即座にアラートが発信されることになるので、いち早く気づけます。
人の手で監視を行う場合はうっかり以上を見逃してしまうこともありますが、そういった心配もありません。作業員のスキル差によるトラブルも起こらないので、信頼性の高い監視につなげたいと考えている場合にもシステム監視ツールの利用がおすすめです。
自社にとって必要な監視項目の洗い出しを行おう
いかがだったでしょうか。システム監視の基本や、監視項目の洗い出し方などについて解説しました。システム監視の種類と項目についても紹介したので、自社で必要なものが見えてきたのではないかと思います。
各社で必要な監査項目は異なるので、自社に合った形で洗い出しを行うことが重要です。
各種データベース製品の導入や運用を支援しているコーソルでは、パフォーマンス監視に関する相談もお受けしています。データベースに関することも含めてお気軽にご相談ください。