ネットワーク監視・トラブルシュート

NPM(Network Performance Monitor) えぬぴーえむ(ねっとわーくぱふぉーまんすもにたー)

ネットワーク監視帯域幅レイテンシSNMPトラフィック分析パフォーマンス管理
NPMについて教えて

簡単に言うとこんな感じ!

NPM(Network Performance Monitor)は、会社のネットワーク全体を「健康診断」してくれるツールだよ!「なんかネットが遅い…」「どこかで詰まってる?」を自動でチェックして、問題が起きる前や起きたときにすぐ教えてくれるんだ。病院の心電図モニターみたいなイメージだね!


NPM(Network Performance Monitor)とは

NPM(Network Performance Monitor) とは、企業や組織のネットワーク機器・回線・トラフィックを継続的に監視し、パフォーマンスの低下・障害・異常を検知・可視化するためのソフトウェアやサービスの総称です。ルーター・スイッチ・ファイアウォールといった機器の状態から、回線の帯域幅(bandwidth)レイテンシ(遅延時間)、パケットロス率まで、ネットワーク全体の健全性を一元管理できます。

情報システム担当者が少ない企業でも、NPMを導入することで「どこで何が起きているか」をダッシュボード上で直感的に把握できます。単なる障害検知にとどまらず、トレンド分析(過去の傾向から将来のボトルネックを予測)やアラート通知(しきい値を超えたら即メール・Slack連携)など、運用を効率化する機能も備えています。

代表的な製品としては SolarWinds NPM・Cisco Prime Infrastructure・PRTG Network Monitor・Datadog Network Monitoring などが知られており、クラウドサービスとして提供されるものも増えています。


NPMが監視する主な指標と仕組み

NPMが収集・分析する主要な指標(メトリクス)は以下のとおりです。

指標説明問題が出ると…
帯域幅使用率回線容量のうち実際に使われている割合動画会議が途切れる、ファイル転送が遅い
レイテンシ(遅延)データが届くまでにかかる時間(ms単位)アプリの反応が遅い、タイムアウトエラー
パケットロス率送ったデータのうち届かなかった割合(%)音声・動画が乱れる、再送が多発する
CPU/メモリ使用率ルーター・スイッチなど機器のリソース消費機器がフリーズ、ネットワーク停止
インターフェース状態物理ポートの Up/Down 状態特定の拠点が孤立する
フロー情報どのアプリ・IPが帯域を使っているか帯域食いつぶしの犯人特定

データ収集の主なプロトコル

NPMがネットワーク機器から情報を集める方法は主に3つです。

  • SNMP(Simple Network Management Protocol) — 機器の状態をポーリング(定期的に問い合わせ)して収集する最も一般的な方法
  • NetFlow / sFlow / IPFIX — ルーターやスイッチが「誰が・どこへ・どれだけ」通信しているかのフロー情報を送る方式
  • ICMP(Ping) — 機器が生きているかを確認する最もシンプルな疎通確認

覚え方:「NPMは”ネットの体温計”」

体温計が熱を測って異常を知らせるように、NPMはネットワークの「温度(パフォーマンス)」を常に計り続けて、高熱(障害)の前に教えてくれる、というイメージで覚えましょう。


歴史と背景

  • 1980年代後半 — SNMPv1 が策定され、ネットワーク機器を遠隔管理する基盤が整備される
  • 1990年代 — 企業ネットワークの拡大とともに、機器管理ツール(NMS: Network Management System)が普及。HP OpenView などが代表格
  • 2000年代前半 — Cisco NetFlow が普及し始め、トラフィックの「見える化」が可能に。SolarWinds がコスト低廉な NPM 製品で市場を拡大
  • 2000年代後半仮想化・クラウドの台頭により、物理機器だけでなく仮想スイッチや VPN トンネルも監視対象に
  • 2010年代 — SaaS 型の監視ツール(Datadog・New Relic など)が登場し、オンプレミス不要の NPM が普及
  • 2020年代 — テレワーク拡大で SD-WAN・クラウド回線の監視需要が急増。AIによる異常検知AIOps)機能を組み込んだ NPM が増加

NPMと関連技術・ツールの比較

NPM は「ネットワーク監視」の一分野ですが、似た用語・ツールと混同しやすいため整理します。

略称正式名称主な対象代表製品
NPMNetwork Performance Monitor回線・機器のパフォーマンスSolarWinds NPM, PRTG
NMSNetwork Management System機器の設定管理・障害管理も含む広義の管理Cisco Prime, Zabbix
APMApplication Performance Monitorアプリの応答速度・エラー率Datadog APM, Dynatrace
SIEMSecurity Information and Event Managementセキュリティログの収集・分析Splunk, Microsoft Sentinel
ITSMIT Service ManagementITサービス全体のインシデント管理ServiceNow, Jira Service

NPMの位置づけ(SVG図解)

IT監視ツールの全体像とNPMの位置づけ NPM Network Performance Monitor 回線・機器の パフォーマンス監視 APM Application Performance Monitor アプリの応答速度・ エラー率監視 SIEM Security Information and Event Mgmt セキュリティログ 収集・分析 NMS(Network Management System) 機器設定・構成管理・障害管理・パフォーマンス管理を包含する広義の概念 NPM は NMS の「パフォーマンス監視」に特化したサブセット

実務での使い分け

  • 「ネットが遅い」「どこかで詰まっている」→ NPM で回線・機器のボトルネックを探す
  • 「アプリが遅い・エラーが多い」→ APM でアプリ層の問題を調べる
  • 「不審な通信・セキュリティインシデント」→ SIEM でログを解析する

3つを組み合わせることで、インフラからアプリ・セキュリティまで網羅した「フルスタック監視」が実現します。


関連する規格・RFC

規格・RFC番号内容
RFC 1157SNMPv1 の仕様。NPM がデータ収集に使う基本プロトコルを定義
RFC 3411SNMPv3 のアーキテクチャ。認証暗号化を追加したセキュアな管理フレームワーク
RFC 3954Cisco NetFlow v9 の仕様。フロー情報収集に広く使われる
RFC 7011IPFIX(IP Flow Information Export)の仕様。NetFlow を標準化したもの
RFC 792ICMP の仕様。Ping による死活監視の基本プロトコル

関連用語

  • SNMP — ネットワーク機器の状態を収集・管理するプロトコル。NPMのデータ収集基盤
  • NetFlow — Cisco が開発したフロー情報エクスポート技術。誰が帯域を使っているか把握できる
  • 帯域幅(バンド幅) — ネットワーク回線が一度に送れるデータ量の上限
  • レイテンシ — データが送信元から宛先に届くまでの遅延時間
  • SIEM — セキュリティイベントログを収集・分析するシステム
  • APM — アプリケーションの応答速度やエラー率を監視するツール
  • Zabbix — オープンソースのネットワーク・サーバー統合監視ツール
  • SLA(Service Level Agreement) — 通信品質の保証基準。NPMの監視データでSLA遵守を確認する