〇論文設計テンプレート
太字:問題文抜粋箇所
設問ア
1. 私が携わったITサービス概要
・○○サービスの運用
○○業を展開している大手
○○を活用した当該サービスを営業部へ提供
○○サービス:ITサービスマネージャ(運用部責任者)
負荷分散装置、WebAPサーバ1.2(2台)、DBサーバ1.2(2台)
SLA(サービスレベル項目):24時間365日稼働(計画メンテナンスを除く)
2.兆候の管理の概要について
〇監視システム
└システム資源の使用状況や性能の状況
インフラ部:各サーバの死活監視、リソース監視(基準値、警告値設定)
監視ベンダーN社:バッチ処理の稼働確認(起動・終了・リミット)/エラー監視文言に基づく検知
〇サービスデスク(運用部)
└利用者からの問い合わせ状況等
ワークフローシステム:営業部からの作業依頼・調査依頼
設問イ
1. サービスレベルが未達となる兆候及びそのように認識した理由
〇監視システム
①WebAPサーバ1号機のリソース状況が上昇傾向にあり警告値を検知するケース
レスポンスタイムがサービスレベルを遵守できない可能性有
└日次5%増、警告値:70%,基準値:80%(インフラ部)
②業務優先度"高"○○バッチが遅延傾向にありリミットを超過するケース
○○バッチ:他システムへの連携有/〇〇データが連携されないため顧客影響大
└監視ベンダーN社からの報告資料(備考欄)
〇サービスデスク(運用部)
・データ強制変更を伴う同一の作業依頼及び調査依頼が多発し希望納期が遵守できないケース
└運用部受付担当者より報告
2. サービスレベルを遵守するために実施した対策及びその結果について
〇監視システム
①閾値の見直し(暫定対応)
└アラート検知なし
上昇原因を分析し適切なリソース増強を実施(恒久対応)
└アクセス量に応じてスケールアウトした結果、アクセス集中日におけるレスポンス性能を維持
②バッチ処理構成の見直し
└終了遅延監視23:30,改善前終了時刻:23:25,改善後終了時刻:23:00(バッファ:30分)
〇サービスデスク(運用部)
・開発部と連携し開発案件として対応
└当該作業依頼・調査依頼がなくなり運用部担当者の負荷軽減
設問ウ
1. 兆候の管理を効果的に行うための工夫
関連部門と連携することによって、様々な情報を多面的に分析
インフラ部:月次傾向分析結果からサービスレベルに影響与える可能性がある場合は運用部へ報告する体制を構築
監視ベンダーN社:報告資料にリミット項目に対する当該バッチ処理の終了時刻を追加(業務優先度"高"のみ)
運用部:同一の作業依頼が多発しているケースが存在した場合は開発部への報告対象とする。(課題管理ミーティング)
営業部:アクセスが集中する期間・日時を予測
2. 兆候の管理の仕組みの改善
仕組みを継続的に改善
月次傾向分析結果:他チームのシステムに相関がある監視項目を随時追加し兆候管理の精度を高める。
報告資料:業務優先度"高"以外のバッチ処理も対象にリミット時間に対する終了時刻の推移を管理する。
課題管理ミーティング:作業依頼から発展した開発案件の進捗を管理し優先度に応じた対応実施する。
・WebAPサーバの増設の検討
・〇〇システムの導入