社内ネットワークでブロードキャストストームが発生

社員がHUBにケーブルを誤接続しネットワークループが発生、全社ネットワークがダウンした際の原因特定から復旧、再発防止までをひとり情シスの視点で解説します。

状況:社内ネットワークが突然全滅した

水曜日の午後2時頃、突然社内の全部署から「ネットワークにつながらない」「ファイルサーバーにアクセスできない」「インターネットが開かない」という問い合わせが殺到しました。午前中は問題なく動いていたネットワークが、午後になって突然全滅するという異常事態です。

影響は甚大で、約40名の社員全員が業務不能になりました。IP電話も使えず、外部からの電話対応もできない状態です。ひとり情シスとして、この混乱の中で迅速に原因を特定し、復旧させなければなりません。

原因:ブロードキャストストームとは何か

調査の結果、原因はネットワークループによるブロードキャストストームでした。営業部の社員が会議のためにデスクを移動する際、LANケーブルを差し替えようとして、同じスイッチングHUBの2つのポートにケーブルの両端を接続してしまったのです。

ネットワークループが発生すると、ブロードキャストパケット(全端末宛ての通信)がスイッチ間で永遠に回り続け、雪だるま式に増大します。これがブロードキャストストームです。ネットワーク帯域が瞬時に飽和し、正常な通信が一切できなくなります。

⚠️ 注意

ブロードキャストストームは発生から数秒でネットワーク全体を機能停止に追い込みます。スイッチのCPU使用率が100%に張り付き、管理画面へのアクセスすらできなくなることがあります。ループを検知する仕組みがないアンマネージドスイッチ(STP非対応の安価なHUB)を使用している環境では特に危険です。

なぜアンマネージドスイッチが問題なのか

中小企業でよく使われる数千円のスイッチングHUBは、ほとんどが「アンマネージドスイッチ」と呼ばれるものです。これらはSTP(Spanning Tree Protocol)というループ防止機能を持たないため、一度ループが発生すると自動的に解消する手段がありません。

  • アンマネージドスイッチ:設定不要で手軽だが、ループ防止機能なし。LEDの異常点滅でしかループを判断できない
  • マネージドスイッチ(L2スイッチ):STP/RSTP対応、ループ検知・遮断機能あり。ログ出力でトラブルシューティングが可能
  • スマートスイッチ:アンマネージドとマネージドの中間。ループ検知機能を持つ機種もある

💡 ポイント

ひとり情シスの現場では、コスト重視でアンマネージドスイッチが大量に使われていることが多いです。しかし、1回のブロードキャストストームで全社の業務が数時間停止するコストを考えると、主要なスイッチをマネージドスイッチに置き換える投資は十分にペイします。まずはコアスイッチ(サーバールーム内の中心的なスイッチ)だけでもマネージドに置き換えることを検討しましょう。

対応手順:ループを特定して解消する

ステップ1:ブロードキャストストームの兆候を確認する

サーバールームに向かい、ネットワーク機器の状態を目視で確認します。ブロードキャストストームが発生している場合、以下の兆候が見られます。

  • スイッチのLEDが全ポート高速で点滅している(通常はデータ通信時のみ点滅)
  • スイッチ本体が異常に発熱している(CPU使用率が限界に達しているため)
  • 管理画面(マネージドスイッチの場合)にアクセスできない
  • pingが通らない、またはタイムアウトと応答が混在する

📋 具体例

アンマネージドスイッチのLED状態を確認してください。正常時はデータ通信のあるポートだけが不規則に点滅しますが、ブロードキャストストーム発生時は全ポートのLEDが一斉に高速点滅します。まるでクリスマスツリーのイルミネーションのように見えるのが特徴です。この状態を見つけたら、ほぼ確実にループが原因です。

ステップ2:ループの場所を特定する

ループの場所を特定するには、以下の手順で「消去法」を使います。

  1. コアスイッチから各フロアスイッチへの接続を1本ずつ抜く。特定のケーブルを抜いた瞬間にLEDの異常点滅が収まれば、そのケーブルの先にあるスイッチ周辺にループがある
  2. 問題のフロアスイッチに移動し、同様にポートを1つずつ抜いてループ箇所を絞り込む
  3. 最終的にループの原因となっているケーブル接続を発見する

⚠️ 注意

ケーブルを抜く作業中は、どのケーブルをどのポートから抜いたか必ず記録(写真撮影推奨)してください。複数のケーブルを抜いて元に戻す際、誤った接続をしてしまうと新たな障害を引き起こします。また、サーバー接続用のケーブルを抜く際は、サーバーに影響がないか注意してください。

ステップ3:ループを解消して復旧を確認する

ループの原因となっているケーブル接続を特定したら、そのケーブルを取り外します。通常、数十秒以内にブロードキャストストームが収まり、ネットワークが正常に戻り始めます。

  1. ループ原因のケーブルを抜く
  2. 各スイッチのLEDが正常な状態に戻ることを確認(1~2分待つ)
  3. 自分のPCからデフォルトゲートウェイ(ルーター)にpingを実行し、応答を確認
  4. インターネット接続とファイルサーバーへのアクセスを確認
  5. 各部署に復旧確認を依頼

💡 ポイント

ブロードキャストストームが長時間続いた場合、一部のスイッチやルーターが不安定な状態に陥っている可能性があります。ループを解消しても完全に復旧しない場合は、コアスイッチとルーターの再起動を行ってください。再起動の順番は「上流(ONU/ルーター)から下流(フロアスイッチ)」が基本です。

ステップ4:社内への報告

復旧後、以下の情報を全社に共有します。

  • 障害の原因(LANケーブルの誤接続によるネットワークループ)
  • 障害の発生時間と復旧時間
  • LANケーブルの取り扱いに関する注意喚起

📋 具体例

報告メール例:「本日14:00頃から発生していたネットワーク障害は、15:30に復旧いたしました。原因はLANケーブルの誤接続によるネットワーク障害です。社員の皆様にお願いです。デスクの移動や配線の変更の際は、LANケーブルの接続先を変更しないでください。配線の変更が必要な場合は、情報システム担当までご連絡ください。」

再発防止策

1. ループ防止機能付きスイッチの導入

最も効果的な対策は、STP(Spanning Tree Protocol)またはループ検知機能を持つスイッチへの置き換えです。すべてを一度に交換する必要はなく、以下の優先順位で段階的に導入します。

  1. コアスイッチ(サーバールーム内):最優先。マネージドL2/L3スイッチを導入
  2. フロアスイッチ(各部署の集約ポイント):次点。ループ検知機能付きスマートスイッチ
  3. 島HUB(デスク周辺の小型HUB):最終。ループ検知機能付きのものに順次交換

📋 具体例

ループ検知機能付きのスイッチは、ループを検知すると該当ポートを自動的に遮断(シャットダウン)します。例えば、NETGEAR GSシリーズやTP-Link TL-SGシリーズの一部モデルは、1台数千円からのスマートスイッチでありながらループ検知機能を搭載しています。全社で一気に導入する予算がなくても、フロアの集約ポイントだけでも導入すれば効果は大きいです。

2. ケーブル管理の徹底

物理的なケーブル管理を改善し、誤接続を予防します。

  • ケーブルにラベルを貼る:両端に接続先のポート番号や用途を記載したラベルを取り付ける
  • 使用していないポートを物理的にふさぐ:ポートブロッカー(数百円)を使い、空きポートへの誤接続を防止
  • 配線図を作成・掲示する:各フロアのLAN配線図を作成し、スイッチ付近に掲示
  • 社員が勝手にHUBを増設しないルールを周知する

3. ネットワーク構成の文書化

現在のネットワーク構成を図にまとめておくと、次回のトラブル対応時に大幅に時間を短縮できます。

  • 物理構成図(どの機器がどこに設置されているか)
  • 論理構成図(IPアドレス体系、VLAN構成など)
  • 各スイッチの設置場所とポート割り当て表

💡 ポイント

ひとり情シスの視点では、「いかに障害を起こさないか」と同時に「起きた時にいかに早く復旧できるか」が重要です。ブロードキャストストームは原因さえ分かれば復旧は早いのですが、原因特定に時間がかかります。ネットワーク構成図があれば、どのスイッチのどのポートを調べればよいか見当がつくため、復旧時間を大幅に短縮できます。Draw.io(無料)やExcelで十分なので、まずは作成してみましょう。

まとめ

  • ブロードキャストストームはLANケーブルの誤接続(ループ)で発生し、数秒で全社ネットワークを停止させる
  • 原因特定はスイッチLEDの異常点滅を目視確認し、消去法でループ箇所を絞り込む
  • STP非対応のアンマネージドスイッチが多い環境では特にリスクが高い
  • 再発防止にはループ検知機能付きスイッチの導入ケーブル管理の徹底が有効
  • ネットワーク構成図の整備が障害復旧の速度を大幅に向上させる