初めてのDR訓練実施

BCP策定後、初めてのDR(ディザスタリカバリ)訓練を計画・実施し、課題を発見・改善した事例をひとり情シスの視点で解説します。

状況:BCPを策定したが、訓練を一度もやっていない

昨年、取引先からの要請でBCP(事業継続計画)を策定しました。大地震やシステム障害を想定し、復旧手順書も作成しました。しかし、策定から1年以上が経過しても一度もDR(ディザスタリカバリ)訓練を実施しておらず、手順書が本当に機能するのか検証されていない状態です。

BCPは「作って終わり」ではなく、定期的な訓練で有効性を検証し、改善し続けることが重要です。今回、ひとり情シスとして初めてのDR訓練を企画・実施した事例を紹介します。

💡 ポイント

ひとり情シスにとって、DR訓練は「やりたいけど手が回らない」業務の筆頭です。しかし、訓練をしないBCPは「絵に描いた餅」です。完璧な訓練を目指す必要はありません。まずは小規模な訓練から始めて、毎年少しずつ範囲を広げていくアプローチが現実的です。初めてのDR訓練であれば、2~3時間程度の簡易訓練で十分です。

計画フェーズ:訓練の準備

ステップ1:訓練の目的と範囲を決める

初めてのDR訓練で全システムの復旧を試みるのはリスクが高いため、範囲を限定します。

今回の訓練の目的

  • バックアップからファイルサーバーのデータを復元できることを確認する
  • 復旧手順書の記載が正確で、手順通りに作業できることを確認する
  • 復旧にかかる時間(RTO:Recovery Time Objective)を実測する
  • 手順書の不備や改善点を発見する

訓練の範囲

  • 対象:ファイルサーバーのバックアップからの復元
  • 方法:本番サーバーとは別のテスト環境で復元を実施(本番環境には影響しない)
  • 参加者:IT担当(自分)+ 総務部1名(記録係)
  • 所要時間:3時間(土曜日の午前中)

⚠️ 注意

DR訓練を本番環境で実施すると、万が一操作ミスがあった場合に本当の障害を引き起こしてしまいます。初めての訓練は必ずテスト環境で実施してください。「本番サーバーのバックアップを、別のPCまたは仮想マシンに復元する」という方法であれば、本番環境に一切影響を与えずに訓練できます。

ステップ2:訓練シナリオの作成

訓練で想定する障害シナリオを具体的に作成します。

📋 具体例

訓練シナリオ:

【想定事象】
震度6強の地震が発生し、サーバールームの天井が一部崩落。ファイルサーバーが物理的に破損し、起動不能となった。Active Directoryサーバーと業務アプリサーバーは正常。ネットワーク機器も正常。

【訓練で確認する項目】
1. バックアップデータの取り出しと確認(外付けHDD / クラウド)
2. 代替ハードウェア(テスト用PC)へのOS・役割のセットアップ
3. バックアップからのデータ復元
4. 共有フォルダの再公開とアクセス確認
5. 各部門のテストユーザーによるファイルアクセス確認

【目標復旧時間(RTO)】:8時間以内
【目標復旧時点(RPO)】:前日のバックアップ時点

ステップ3:訓練計画書の作成と承認

訓練計画書を作成し、上長(総務部長または社長)の承認を得ます。

訓練計画書に含める項目

  • 訓練の目的と範囲
  • 想定シナリオ
  • 実施日時と場所
  • 参加者と役割分担
  • 必要な機材・リソース
  • タイムスケジュール
  • 中止条件(本番環境に影響が出た場合は即時中止)
  • 訓練後の報告スケジュール

💡 ポイント

訓練計画書を上長に提出する際、「訓練を行わないリスク」も合わせて説明しましょう。「BCPの手順書が機能しない場合、実際の災害時に復旧が大幅に遅れ、業務停止が長期化する恐れがあります」という説明は経営層に響きます。また、取引先からのBCP要件に「定期的な訓練の実施」が含まれている場合は、それも根拠として提示しましょう。

実施フェーズ:訓練の実行

ステップ4:テスト環境の準備

訓練で使用するテスト環境を準備します。

  • テスト用PC:予備のデスクトップPCまたはノートPC(スペックはサーバーより低くてもOK)
  • バックアップメディア:外付けHDD(本番のバックアップデータが入ったもの)
  • OSインストールメディア:Windows ServerのインストールUSBまたはDVD
  • 復旧手順書:紙に印刷したもの(PCが使えない状況を想定)
  • 記録用紙とストップウォッチ:各作業の所要時間と手順の記録用

ステップ5:訓練の実行と記録

訓練シナリオに従い、復旧手順書の通りに作業を進めます。記録係は各作業の開始時刻・終了時刻と、手順書との差異を記録します。

訓練タイムライン(実績)

📋 具体例

09:00 訓練開始。バックアップHDDの取り出しと接続
09:10 バックアップデータの一覧確認。最新のバックアップ日時を確認
09:15 テスト用PCにWindows Serverのインストール開始
10:00 OSインストール完了。基本設定(コンピューター名、IPアドレス等)を実施
10:20 ファイルサーバーの役割をインストール
10:30 Windows Serverバックアップからのデータ復元を開始
11:15 データ復元完了(約200GBの復元に45分)
11:20 共有フォルダの設定とアクセス権の確認
11:40 テスト用PCからファイルアクセスの確認
11:50 各部門のテストフォルダのファイルが正常に開けることを確認
12:00 訓練終了

実測復旧時間:3時間(目標の8時間以内を達成)

ステップ6:訓練中に発見された課題

訓練を通じて、以下の課題が発見されました。

課題1:手順書にWindows Serverのプロダクトキーが記載されていなかった

OSインストール時にプロダクトキーが必要だが、手順書に記載がなく、ライセンス証書を探すのに15分を浪費した。

課題2:バックアップからの復元コマンドが手順書と実際の画面で異なっていた

手順書がWindows Server 2012 R2の画面をもとに作成されており、現在のWindows Server 2022の画面と一致していなかった。

課題3:共有フォルダのアクセス権がバックアップに含まれていなかった

データは復元できたが、NTFSアクセス権が復元されず、全フォルダが「Everyone:フルコントロール」の状態になった。アクセス権の再設定に追加の時間が必要。

課題4:業務アプリケーションの復旧手順が手順書に含まれていなかった

今回の訓練範囲外だが、業務アプリケーション(基幹システム)のサーバー復旧手順が未作成であることが判明。

⚠️ 注意

DR訓練で課題が見つかるのは「成功」です。実際の災害時に初めて気づくよりもはるかに良い状態です。課題を隠したり過小評価したりせず、すべて記録して改善につなげてください。「課題がゼロ」という訓練結果は、訓練の範囲が狭すぎるか、チェックが甘い可能性があります。

改善フェーズ:課題への対応

ステップ7:訓練報告書の作成

訓練結果を報告書にまとめ、上長に報告します。

報告書に含める項目

  • 訓練の概要(日時、参加者、シナリオ)
  • 訓練結果のサマリー(成功/失敗、実測復旧時間)
  • 発見された課題の一覧と対応方針
  • 次回訓練の計画(日程、拡大する範囲)

📋 具体例

訓練報告書のサマリー例:

【訓練結果】:成功(条件付き)
・バックアップからのデータ復元は正常に完了
・実測復旧時間:3時間(目標8時間以内を達成)
・ただし、4件の課題が発見され、改善が必要

【改善アクション】
1. 手順書にプロダクトキーを追記(1週間以内)
2. 手順書の画面キャプチャを最新OSに更新(2週間以内)
3. バックアップ設定にアクセス権(ACL)を含める(1週間以内)
4. 業務アプリケーションの復旧手順書を新規作成(1ヶ月以内)

【次回訓練予定】:6ヶ月後。Active Directoryサーバーの復旧訓練を追加。

ステップ8:手順書の改善と次回訓練の計画

発見された課題に基づいて手順書を改善し、次回の訓練計画を立てます。

  • 手順書の修正・更新(課題1~3への対応)
  • 業務アプリケーションの復旧手順書の新規作成(課題4への対応)
  • 次回訓練の範囲拡大計画(ADサーバー、業務アプリサーバーを対象に追加)
  • 訓練の年間スケジュール策定(年2回の定期訓練を目標)

💡 ポイント

ひとり情シスの視点では、DR訓練を「年に1回の大イベント」にするのではなく、「四半期ごとの小さな検証」にするのが持続可能です。例えば、1月:ファイルサーバー復元テスト、4月:ADサーバー復元テスト、7月:バックアップの復元確認(データの整合性チェック)、10月:全体的なシナリオ訓練、のようなサイクルを回すと、1回あたりの負荷が軽くなり、継続しやすくなります。

まとめ

  • BCPは策定するだけでは不十分。定期的なDR訓練で有効性を検証することが不可欠
  • 初めてのDR訓練は範囲を限定し、テスト環境で実施する。完璧を目指さなくてよい
  • 訓練で課題が見つかるのは「成功」。実際の災害時に気づくより遥かに良い
  • 訓練結果は報告書にまとめて経営層に共有し、改善アクションを実行する
  • 年に2回以上の定期訓練をスケジュール化し、毎回少しずつ範囲を拡大する