社内ネットワークが突然つながらなくなった

社内ネットワークが突然つながらなくなった際の原因切り分けから復旧までの対応手順を、ひとり情シスの視点で実践的に解説します。

状況:社内ネットワークが突然つながらなくなった

月曜日の朝、出社した社員から「インターネットにつながらない」「社内のファイルサーバーにアクセスできない」という問い合わせが殺到する――ひとり情シスにとって最も多いトラブルの一つです。全社的なネットワーク障害は業務が完全に停止するため、迅速かつ冷静な対応が求められます。

このケースでは、ある朝突然社内の有線・無線LANの両方がつながらなくなり、約30名の社員が業務不能になったという状況を想定して、原因の切り分けから復旧までの手順を解説します。

原因:何が起きていたのか

ネットワーク障害の原因は多岐にわたりますが、代表的なものは以下の通りです。

  • ルーター・スイッチの故障や暴走:長期間再起動せず運用していた機器が熱暴走やメモリリークで停止
  • DHCPサーバーの障害:IPアドレスが払い出せず、端末がネットワークに参加できない
  • LANケーブルの断線やループ:社員がケーブルを誤接続し、ブロードキャストストームが発生
  • ISP(インターネットサービスプロバイダ)側の障害:社内設備には問題がなく、上流で障害が発生
  • ファイアウォール・UTMの設定ミスやライセンス切れ:セキュリティ機器がトラフィックをブロック

今回のケースでは、コアスイッチ(全フロアのネットワークを束ねる中心的なスイッチングハブ)が熱暴走により応答停止していたことが原因でした。サーバールームの空調が週末に故障し、室温が40度を超えていたことが根本原因です。

対応手順:冷静に切り分けて復旧する

ステップ1:影響範囲を確認する

まず「全社的な障害なのか」「特定のフロアやエリアだけの障害なのか」を把握します。複数の部署からの報告を集め、影響範囲を素早く特定しましょう。

📋 具体例

「営業部はつながらないが、経理部はつながる」→ フロア別スイッチの問題の可能性。「全社的に全滅」→ コアスイッチ、ルーター、ISP障害の可能性。自分のPCから ping 192.168.1.1(デフォルトゲートウェイ)を実行して応答を確認するのが最初の一手です。

ステップ2:物理層から確認する

ネットワーク機器の設置場所(サーバールーム・通信機器ラック)に行き、以下を目視確認します。

  1. ルーター・スイッチのLEDランプは正常に点灯しているか
  2. ケーブルの抜けや緩みはないか
  3. 異常な発熱や異臭はないか
  4. ONU(光回線終端装置)のランプ状態は正常か

⚠️ 注意

サーバールームの温度異常を発見した場合、まず扉を開放して換気し、可能であればポータブル冷房や扇風機を設置してください。高温環境での機器稼働は故障リスクを高め、最悪の場合は発火の危険もあります。

ステップ3:機器の再起動を試みる

物理的な問題がない場合、以下の順序で機器を再起動します。

  1. ONUの電源OFF → 30秒待機 → 電源ON
  2. ルーターの電源OFF → 30秒待機 → 電源ON
  3. コアスイッチの電源OFF → 30秒待機 → 電源ON
  4. フロアスイッチ(必要に応じて)

再起動後、各機器のLEDが正常に点灯するまで2~3分待ち、自分のPCからインターネットおよび社内サーバーへの接続を確認します。

💡 ポイント

再起動の順番は「上流から下流へ」が基本です。ISP側に近い機器(ONU)から順に再起動することで、各機器が正しい接続情報を順次取得できます。逆順に行うと、上流が不安定な状態で下流が起動し、正しく接続できない場合があります。

ステップ4:ISP障害の確認

社内機器を再起動しても復旧しない場合、ISP側の障害を疑います。スマートフォンのモバイル回線を使って、ISPの障害情報ページやSNSを確認しましょう。ISPのサポート窓口に電話する際は、ONUのランプ状態を事前にメモしておくとスムーズです。

ステップ5:社内への状況報告

原因が判明したら(あるいは調査中でも)、全社員に状況を報告します。メールが使えない場合は、チャットツール(モバイル回線経由)、社内放送、直接の口頭伝達を活用しましょう。

📋 具体例

報告テンプレート:「現在、社内ネットワーク障害が発生しています。原因はサーバールームの空調故障による機器停止と判明し、現在復旧作業中です。復旧見込みは○時○分頃です。ご不便をおかけしますが、しばらくお待ちください。」

再発防止策

1. ネットワーク構成図を作成・維持する

どの機器がどこに設置され、どのようにケーブル接続されているかを図にまとめます。障害時の切り分けが格段に速くなります。ExcelやDraw.io(無料)で十分です。

2. サーバールームの温度監視を導入する

安価なネットワーク対応温度センサー(数千円程度)を設置し、異常温度になったらメールやLINEで通知される仕組みを構築します。SwitchBotの温湿度計などが手軽です。

3. 機器の定期再起動スケジュールを設定する

月に1回程度、業務時間外にルーターやスイッチの再起動を行うことで、メモリリークや不安定動作を予防できます。タイマー付き電源タップを使えば自動化も可能です。

4. 予備機器を確保する

コアスイッチやルーターの予備を1台ずつ確保しておくと、故障時にすぐ交換でき、復旧時間を大幅に短縮できます。

💡 ポイント

ネットワーク障害は「年に一度は起こるもの」と考え、復旧手順書をあらかじめ作成しておきましょう。障害発生時はパニックになりがちですが、手順書があれば落ち着いて対処できます。手順書はサーバールームに紙で掲示しておくのがおすすめです(ネットワーク障害時は電子ファイルにアクセスできないため)。

まとめ

  • ネットワーク障害はまず影響範囲の特定から始める
  • 物理層(ケーブル・ランプ・温度)の確認を怠らない
  • 機器の再起動は上流から下流への順番で行う
  • ISP障害の可能性も常に念頭に置く
  • ネットワーク構成図と復旧手順書を事前に準備しておくことが最大の備え