社内ネットワークでブロードキャストストームが発生
社員がHUBにケーブルを誤接続しネットワークループが発生、全社ネットワークがダウンした際の原因特定から復旧、再発防止までをひとり情シスの視点で解説します。
状況:社内ネットワークが突然全滅した
水曜日の午後2時頃、突然社内の全部署から「ネットワークにつながらない」「ファイルサーバーにアクセスできない」「インターネットが開かない」という問い合わせが殺到しました。午前中は問題なく動いていたネットワークが、午後になって突然全滅するという異常事態です。
影響は甚大で、約40名の社員全員が業務不能になりました。IP電話も使えず、外部からの電話対応もできない状態です。ひとり情シスとして、この混乱の中で迅速に原因を特定し、復旧させなければなりません。
原因:ブロードキャストストームとは何か
調査の結果、原因はネットワークループによるブロードキャストストームでした。営業部の社員が会議のためにデスクを移動する際、LANケーブルを差し替えようとして、同じスイッチングHUBの2つのポートにケーブルの両端を接続してしまったのです。
ネットワークループが発生すると、ブロードキャストパケット(全端末宛ての通信)がスイッチ間で永遠に回り続け、雪だるま式に増大します。これがブロードキャストストームです。ネットワーク帯域が瞬時に飽和し、正常な通信が一切できなくなります。
⚠️ 注意
ブロードキャストストームは発生から数秒でネットワーク全体を機能停止に追い込みます。スイッチのCPU使用率が100%に張り付き、管理画面へのアクセスすらできなくなることがあります。ループを検知する仕組みがないアンマネージドスイッチ(STP非対応の安価なHUB)を使用している環境では特に危険です。
なぜアンマネージドスイッチが問題なのか
中小企業でよく使われる数千円のスイッチングHUBは、ほとんどが「アンマネージドスイッチ」と呼ばれるものです。これらはSTP(Spanning Tree Protocol)というループ防止機能を持たないため、一度ループが発生すると自動的に解消する手段がありません。
- アンマネージドスイッチ:設定不要で手軽だが、ループ防止機能なし。LEDの異常点滅でしかループを判断できない
- マネージドスイッチ(L2スイッチ):STP/RSTP対応、ループ検知・遮断機能あり。ログ出力でトラブルシューティングが可能
- スマートスイッチ:アンマネージドとマネージドの中間。ループ検知機能を持つ機種もある
💡 ポイント
ひとり情シスの現場では、コスト重視でアンマネージドスイッチが大量に使われていることが多いです。しかし、1回のブロードキャストストームで全社の業務が数時間停止するコストを考えると、主要なスイッチをマネージドスイッチに置き換える投資は十分にペイします。まずはコアスイッチ(サーバールーム内の中心的なスイッチ)だけでもマネージドに置き換えることを検討しましょう。
対応手順:ループを特定して解消する
ステップ1:ブロードキャストストームの兆候を確認する
サーバールームに向かい、ネットワーク機器の状態を目視で確認します。ブロードキャストストームが発生している場合、以下の兆候が見られます。
- スイッチのLEDが全ポート高速で点滅している(通常はデータ通信時のみ点滅)
- スイッチ本体が異常に発熱している(CPU使用率が限界に達しているため)
- 管理画面(マネージドスイッチの場合)にアクセスできない
- pingが通らない、またはタイムアウトと応答が混在する
📋 具体例
アンマネージドスイッチのLED状態を確認してください。正常時はデータ通信のあるポートだけが不規則に点滅しますが、ブロードキャストストーム発生時は全ポートのLEDが一斉に高速点滅します。まるでクリスマスツリーのイルミネーションのように見えるのが特徴です。この状態を見つけたら、ほぼ確実にループが原因です。
ステップ2:ループの場所を特定する
ループの場所を特定するには、以下の手順で「消去法」を使います。
- コアスイッチから各フロアスイッチへの接続を1本ずつ抜く。特定のケーブルを抜いた瞬間にLEDの異常点滅が収まれば、そのケーブルの先にあるスイッチ周辺にループがある
- 問題のフロアスイッチに移動し、同様にポートを1つずつ抜いてループ箇所を絞り込む
- 最終的にループの原因となっているケーブル接続を発見する
⚠️ 注意
ケーブルを抜く作業中は、どのケーブルをどのポートから抜いたか必ず記録(写真撮影推奨)してください。複数のケーブルを抜いて元に戻す際、誤った接続をしてしまうと新たな障害を引き起こします。また、サーバー接続用のケーブルを抜く際は、サーバーに影響がないか注意してください。
ステップ3:ループを解消して復旧を確認する
ループの原因となっているケーブル接続を特定したら、そのケーブルを取り外します。通常、数十秒以内にブロードキャストストームが収まり、ネットワークが正常に戻り始めます。
- ループ原因のケーブルを抜く
- 各スイッチのLEDが正常な状態に戻ることを確認(1~2分待つ)
- 自分のPCからデフォルトゲートウェイ(ルーター)にpingを実行し、応答を確認
- インターネット接続とファイルサーバーへのアクセスを確認
- 各部署に復旧確認を依頼
💡 ポイント
ブロードキャストストームが長時間続いた場合、一部のスイッチやルーターが不安定な状態に陥っている可能性があります。ループを解消しても完全に復旧しない場合は、コアスイッチとルーターの再起動を行ってください。再起動の順番は「上流(ONU/ルーター)から下流(フロアスイッチ)」が基本です。
ステップ4:社内への報告
復旧後、以下の情報を全社に共有します。
- 障害の原因(LANケーブルの誤接続によるネットワークループ)
- 障害の発生時間と復旧時間
- LANケーブルの取り扱いに関する注意喚起
📋 具体例
報告メール例:「本日14:00頃から発生していたネットワーク障害は、15:30に復旧いたしました。原因はLANケーブルの誤接続によるネットワーク障害です。社員の皆様にお願いです。デスクの移動や配線の変更の際は、LANケーブルの接続先を変更しないでください。配線の変更が必要な場合は、情報システム担当までご連絡ください。」
再発防止策
1. ループ防止機能付きスイッチの導入
最も効果的な対策は、STP(Spanning Tree Protocol)またはループ検知機能を持つスイッチへの置き換えです。すべてを一度に交換する必要はなく、以下の優先順位で段階的に導入します。
- コアスイッチ(サーバールーム内):最優先。マネージドL2/L3スイッチを導入
- フロアスイッチ(各部署の集約ポイント):次点。ループ検知機能付きスマートスイッチ
- 島HUB(デスク周辺の小型HUB):最終。ループ検知機能付きのものに順次交換
📋 具体例
ループ検知機能付きのスイッチは、ループを検知すると該当ポートを自動的に遮断(シャットダウン)します。例えば、NETGEAR GSシリーズやTP-Link TL-SGシリーズの一部モデルは、1台数千円からのスマートスイッチでありながらループ検知機能を搭載しています。全社で一気に導入する予算がなくても、フロアの集約ポイントだけでも導入すれば効果は大きいです。
2. ケーブル管理の徹底
物理的なケーブル管理を改善し、誤接続を予防します。
- ケーブルにラベルを貼る:両端に接続先のポート番号や用途を記載したラベルを取り付ける
- 使用していないポートを物理的にふさぐ:ポートブロッカー(数百円)を使い、空きポートへの誤接続を防止
- 配線図を作成・掲示する:各フロアのLAN配線図を作成し、スイッチ付近に掲示
- 社員が勝手にHUBを増設しないルールを周知する
3. ネットワーク構成の文書化
現在のネットワーク構成を図にまとめておくと、次回のトラブル対応時に大幅に時間を短縮できます。
- 物理構成図(どの機器がどこに設置されているか)
- 論理構成図(IPアドレス体系、VLAN構成など)
- 各スイッチの設置場所とポート割り当て表
💡 ポイント
ひとり情シスの視点では、「いかに障害を起こさないか」と同時に「起きた時にいかに早く復旧できるか」が重要です。ブロードキャストストームは原因さえ分かれば復旧は早いのですが、原因特定に時間がかかります。ネットワーク構成図があれば、どのスイッチのどのポートを調べればよいか見当がつくため、復旧時間を大幅に短縮できます。Draw.io(無料)やExcelで十分なので、まずは作成してみましょう。
まとめ
- ブロードキャストストームはLANケーブルの誤接続(ループ)で発生し、数秒で全社ネットワークを停止させる
- 原因特定はスイッチLEDの異常点滅を目視確認し、消去法でループ箇所を絞り込む
- STP非対応のアンマネージドスイッチが多い環境では特にリスクが高い
- 再発防止にはループ検知機能付きスイッチの導入とケーブル管理の徹底が有効
- ネットワーク構成図の整備が障害復旧の速度を大幅に向上させる