作品一覧

  • 【改訂新版】システム障害対応の教科書
    3.5
    1巻3,080円 (税込)
    【障害対応時の基本動作と現場マネジメントがわかる!】 本書は、ITシステム障害対応の現場で必要なさまざまな知識とノウハウ(基本動作、ツール、必要ドキュメントなど)を体系化し、個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や、実際に作業にあたる作業担当者が知っておくべき知識を解説するとともに、高い障害対応力を備えた組織作りについても紹介します。改訂新版では、チームメンバーの教育と育成、障害対応訓練実施のポイント、事故を防ぐ手順書の作り方、エンドユーザ向け情報発信についての章を新設しました。また、生成AI技術のシステム運用への応用についても紹介しています。 ■こんな方におすすめ ・ITサービスに関わるすべての人 ・ITシステムの障害対応に携わる人 ・システム障害時の対応について体系的な知識を知りたい人 ■目次 ●第1章 システム障害対応を学ぶ意義   1.1 なぜシステム障害対応は暗黙知だったのか   1.2 上昇し続けるシステム障害対応の難易度   1.3 システム障害対応時に起こり得るさまざまな問題 ●第2章 システム障害の定義   2.1 システム障害とは何か   2.2 システム障害対応の目的と定義 ●第3章 システム障害対応の登場人物と役割   3.1 システム障害対応の登場人物の概要と体制   3.2 インシデントコマンダーの役割と基本動作   3.3 作業担当   3.4 ユーザ担当   3.5 CIO ●第4章 各プロセスの基本動作~発生から終息まで   4.1 検知・事象の確認   4.2 業務影響調査   4.3 原因調査   4.4 復旧対応   4.5 イベントの確認/事後対応 ●第5章 障害対応に必要なドキュメント   5.1 障害対応フロー図   5.2 オンコールシフト表と連絡先管理表   5.3 障害レベル管理表   5.4 障害状況ボード   5.5 作業タイムチャートシフト表 ●第6章 システム障害対応力を高めるツールと環境   6.1 大規模システム障害のコントロール   6.2 システム監視ダッシュボード   6.3 War Roomダッシュボード   6.4 War Room   6.5 構成管理データベース(CMDB)   6.6 システム運用におけるAIの活用 ●第7章 組織の障害対応レベル向上と体制作り   7.1 障害対応レベルの維持・向上   7.2 障害対応を担う組織や体制 ●第8章 システム障害対応力の改善と教育   8.1 組織の障害対応力の継続的な改善   8.2 教育と訓練 ●第9章 教育と育成の手引き   9.1 作業担当とインシデントコマンダーに必要な能力   9.2 障害対応チームの育成の流れ   9.3 障害対応力スキルチェックシート ●第10章 障害対応訓練の実施   10.1 訓練手法の種類と適切な選択   10.2 訓練の実施要領 ●第11章 事故を防ぐ手順書の作り方   11.1 ヒューマンエラーとは   11.2 ヒューマンエラーを防ぐ手順書の作成 ●第12章 エンドユーザ向けの情報発信   12.1 エンドユーザ向けの情報発信の目的と内容   12.2 エンドユーザ向けの情報発信の方法 ●Appendix 難易度の高いシステム障害ケース   ケース1 ビジネスロジックアプリケーション障害と「誤データの波及」   ケース2 インフラ障害における機器の「半死」   ケース3 大規模インフラ障害と「伝言ゲーム」   ケース4 キャパシティ障害   ケース5 災害時のコントロール~3.11のふりかえり ■著者プロフィール 木村誠明:株式会社野村総合研究所 システムコンサルタント。金融系業務システムの開発・保守運用に携わり多くの障害対応を経験。その後、システム運用高度化のための技術開発・サービス開発を実施。現在はITサービスマネジメントの専門家として、社内外のシステム運用の改善に携わるとともに、障害対応力向上のための研修講師も手掛ける。NRI認定ITサービスマネージャー。
  • システム障害対応の教科書
    3.7
    ITサービスにシステム障害はつきものです。システム障害発生時に適切な対応ができるかどうかでユーザへの影響は大きく変わり、うまくできずに被害を拡大させてしまった事例も多くあります。これは、システム障害対策の現場で必要なノウハウ(基本動作、ツール、必要ドキュメントなど)が体系化されておらず、暗黙知になっていることが一因です。本書は、これまで暗黙知だったシステム障害対応を体系的にまとめて形式知とすることで、個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や、実際に作業にあたる作業者が知っておくべき知識を解説するとともに、高い障害対応力を備えた組織作りや教育の仕組みについても紹介します。
  • 【改訂新版】システム障害対応の教科書

    Posted by ブクログ

    難しいことが書いてあるわけではなく,やるべきこと,考えるべきことなどが淡々と言語化されている.
    ITの現場で暗黙知としてあるいは属人的なスキルとして確立していた障害対応を汎用的な内容で形式知とする取り組みはもっと評価されてもいいんじゃなかろうか.

    システム障害対応の経験がないけど,その分野の知識が求められる自分のような人には良いだろう.

    -----------------------------------

    ・仮想化
     →エラーポイントが疎結合
     →システム構成の複雑化

    ・原因調査
     →仮説立案から.
     →事象からあたりどころをつける.
      (ネットワーク,物理サーバ)
    ・ビジネスロジ

    0
    2024年09月16日
  • システム障害対応の教科書

    Posted by ブクログ

    運用周りの勉強に。

    新しい技術の話もある。カオスエンジニアリングなど
    自身の業務の振り返りにもなる。未熟なエンジニアのあるあるなど共感出来るところも多かった。
    また読みたいので、本棚に置きます。

    0
    2022年07月31日
  • システム障害対応の教科書

    Posted by ブクログ

    障害対応における登場人物、基本動作、必要なドキュメントやツールなどがまとまって解説されている。経験が多い人が読んでも現行フローの改善点を見つけるヒントになりそう。

    0
    2021年10月29日
  • システム障害対応の教科書

    Posted by ブクログ

    障害対応について,組織単位での共通認識が求められる中で,本書はそのフレームワークとして参考になることが多いと思う。IT分野の人は一通り読んでおいて損はない。

    0
    2021年01月23日
  • システム障害対応の教科書

    Posted by ブクログ

    体系的に振り返るには最適な一冊だった。
    現場によって様々なやり方があると思うが、こういった基本と照らし合わせることで課題が見えることもあると再認識した。

    0
    2020年09月13日

新規会員限定 70%OFFクーポンプレゼント!