〇論文設計テンプレート
太字:問題文抜粋箇所
設問ア
1.私が携わったITサービスの概要
・〇〇サービスの運用
〇〇業を展開している大手
〇〇を活用した当該サービスを営業部へ提供
〇〇サービス:ITサービスマネージャ(運用部責任者)
負荷分散装置、WebAPサーバ1.2(2台)、DBサーバ1.2(2台)
FW・SSL通信
外部連携機関:K社(外部供給者)
2.発生した重大インシデントの概要及び利害関係者について
2.1発生した重要インシデントの概要
・K社通信障害により△△サービスの一部機能の利用不可
〇当該サービス登録加盟店
購入者の〇〇情報が未連携による〇〇発行
〇購入者
K社△△サービスの利用不可
重複データ発生の可能性
〇外部供給者:K社
データ不整合
当社〇〇サービス⇔外部連携機関(K社)
2.2利害関係者について
〇顧客:営業部、登録加盟店、購入者
〇サービスデスク:運用部
〇外部供給者:K社、N社
K社:△△サービスの利用不可
└〇〇マスタ:購入者の〇〇情報等を登録するマスタ
└登録後、購入者が△△サービス利用可能
N社:エラー監視を専門としたベンダー
設問イ
1.重大インシデントの対応手順の内容
・重大インシデントの定義
顧客向けサービスの1つを一部の顧客が使用できない状態
・インシデント対応チームを編成して組織的な対応を実施
〇対応手順
①記録
インシデント発生通知を受け付け、受付内容をRedMineに記録
・営業部よりK社の障害連絡通知
└インシデント対応チーム(開発・運用部):想定される影響範囲の洗い出し
1.購入者の〇〇情報未連携による〇〇対象リストの洗い出し及びパッチ対応
2.K社△△サービス利用不可
└購入者:〇〇画面でのお知らせ掲載
└加盟店:〇〇画面でのお知らせ掲載
3.K社との不整合データの洗い出し及びパッチ対応
4.影響件数一覧
②優先度の割り当て
優先度によって解決目標時間を定める
(優先度高:4時間、中:24時間、低:48時間)
1.中(翌日9時まで)
└〇〇JOB稼働
2.高(営業部とお知らせ掲載文言調整の上、即時反映)
3.高(K社と対象リストを合意の上、パッチ対応)
4.低(K社復旧報告に伴い実施)
③分類
インシデントを、あらかじめ決められたカテゴリ(ストレージの障害など)に分類
④記録の更新
インシデントの内容、割り当てた優先度、分類したカテゴリの内容などで、RedMineを更新
⑤段階的取扱い(エスカレーション)
1.3.4:開発部(インシデント対応チーム)へ連携(回答期限を設ける)
2.サービスデスク(インシデント対応チーム)が対応手順書に基づき実施(⑤不要)
※重要インシデントのためインシデント対応チームで実施
⑥解決
・対応手順書又はエスカレーション先からの調査の回答を基に解決に向けた対処を行う。
・営業部が対処すべき作業がある場合は、営業部に作業を依頼する。
⑦終了
・インシデントが解決したことを営業部に確認する。
・回答内容などの記録を更新し、終了する。(RedMine)
2.対応における利害関係者とのコミュニケーション方法について
2.1情報の正確性
〇顧客:営業部(登録加盟店、購入者)
〇サービスデスク:運用部
営業部と調整しお知らせ掲載文言を運用部(インシデント対応チーム)へ連携
情報の正確性を担保するための指定のフォーマットで依頼
・購入者〇〇画面へのお知らせ掲載
・加盟店〇〇画面へのお知らせ掲載
〇外部供給者:K社
K社と調整し不整合データを連携し対象リストのパッチ対応
情報の正確性を担保するための運用部及びK社の対象リストの突合を実施
3.K社との不整合データの洗い出し及びパッチ対応
2.2対応の迅速性(時系列を記載:時間軸)
K社ホームページ掲載:YYYY年MM月DD日13時30分頃からYYYY年MM月DD日hh時mm分
〇顧客:営業部(登録加盟店、購入者)
〇サービスデスク:運用部
14時00分:営業部より運用部責任者へK社障害の旨を電話・メール
14時30分:運用部責任者よりK社障害の影響を営業部へ電話・メール(緊急メール発報)
15時30分:営業部よりお知らせ掲載文言フォーマット連携及び運用部へ作業依頼
17時00分:運用部より開発機検証結果連携(お知らせ掲載文言)
17時30分:営業部確認の上、本番機対応依頼
17時45分:運用部担当者より本番機へ反映
18時00分:営業部確認の上、クローズ(2.お知らせ掲載文言変更)
〇外部供給者:K社
15時00分:K社から営業部へ障害発生の旨連絡
運用部責任者よりK社担当者へ障害影響一覧送付
19時00分:K社担当者より運用部担当者へ不整合リスト送付
20時00分:運用部担当者より開発機検証連携の上、本番機へ反映
設問ウ
1.重大インシデントへの対応で明確になったコミュニケーションにおける課題
サービス回復後
・月次定例会
〇顧客:営業部
〇サービスデスク:運用部
〇外部供給者:K社、N社
①営業部(登録加盟店)からの問合せに基づきインシデント検知
└K社からの連絡が障害発生から1時間30分後の15時00分
└N社検知対象外
②お知らせ掲載文言の反映に時間を要した(営業部⇔運用部責任者⇔サービスデスク:インシデント対応チーム)
③K社担当者より運用部担当者へ不整合リスト送付に時間を要した
④テレワークにおけるコミュニケーションの迅速性
2.コミュニケーションにおける改善策
〇顧客:営業部
①営業部(登録加盟店、購入者)からの問合せに基づきインシデント検知(運用検知に変更)
└K社からの連絡が障害発生時から1時間30分後
⇒障害発生から原則30分以内の公表を求める
└N社検知対象外
⇒エラー監視文言の見直し
②お知らせ掲載文言の反映に時間を要した
⇒お知らせ掲載文言を予め定める
(営業部⇔サービスデスク:インシデント対応チーム)
④重要インシデントのteamsチャンネルの立ち上げ(開発・運用部、営業部の関係者等)
⇒インシデント対応チームのメンバで編成
⇒コミュニケーションの迅速性を図る
〇サービスデスク:運用部
②お知らせ掲載文言の反映に時間を要した
⇒開発機検証結果を営業部へ送付し確認対応に時間を要した
⇒緊急時の開発機検証結果の確認を不要とする。
〇外部供給者:K社、N社
①営業部(登録加盟店)からの問合せに基づきインシデント検知
└K社からの連絡が障害発生時から1時間30分後
⇒障害発生から原則30分以内の公表を求める
└N社検知対象外
⇒エラー監視文言の見直し
③K社担当者より運用部(インシデント対応チーム)へ不整合リスト送付に時間を要した
⇒不整合リスト作成期限を定める。(コミュニケーションギャップの解消)