ヒューマンエラーとは作品一覧
-
-【障害対応時の基本動作と現場マネジメントがわかる!】 本書は、ITシステム障害対応の現場で必要なさまざまな知識とノウハウ(基本動作、ツール、必要ドキュメントなど)を体系化し、個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や、実際に作業にあたる作業担当者が知っておくべき知識を解説するとともに、高い障害対応力を備えた組織作りについても紹介します。改訂新版では、チームメンバーの教育と育成、障害対応訓練実施のポイント、事故を防ぐ手順書の作り方、エンドユーザ向け情報発信についての章を新設しました。また、生成AI技術のシステム運用への応用についても紹介しています。 ■こんな方におすすめ ・ITサービスに関わるすべての人 ・ITシステムの障害対応に携わる人 ・システム障害時の対応について体系的な知識を知りたい人 ■目次 ●第1章 システム障害対応を学ぶ意義 1.1 なぜシステム障害対応は暗黙知だったのか 1.2 上昇し続けるシステム障害対応の難易度 1.3 システム障害対応時に起こり得るさまざまな問題 ●第2章 システム障害の定義 2.1 システム障害とは何か 2.2 システム障害対応の目的と定義 ●第3章 システム障害対応の登場人物と役割 3.1 システム障害対応の登場人物の概要と体制 3.2 インシデントコマンダーの役割と基本動作 3.3 作業担当 3.4 ユーザ担当 3.5 CIO ●第4章 各プロセスの基本動作~発生から終息まで 4.1 検知・事象の確認 4.2 業務影響調査 4.3 原因調査 4.4 復旧対応 4.5 イベントの確認/事後対応 ●第5章 障害対応に必要なドキュメント 5.1 障害対応フロー図 5.2 オンコールシフト表と連絡先管理表 5.3 障害レベル管理表 5.4 障害状況ボード 5.5 作業タイムチャートシフト表 ●第6章 システム障害対応力を高めるツールと環境 6.1 大規模システム障害のコントロール 6.2 システム監視ダッシュボード 6.3 War Roomダッシュボード 6.4 War Room 6.5 構成管理データベース(CMDB) 6.6 システム運用におけるAIの活用 ●第7章 組織の障害対応レベル向上と体制作り 7.1 障害対応レベルの維持・向上 7.2 障害対応を担う組織や体制 ●第8章 システム障害対応力の改善と教育 8.1 組織の障害対応力の継続的な改善 8.2 教育と訓練 ●第9章 教育と育成の手引き 9.1 作業担当とインシデントコマンダーに必要な能力 9.2 障害対応チームの育成の流れ 9.3 障害対応力スキルチェックシート ●第10章 障害対応訓練の実施 10.1 訓練手法の種類と適切な選択 10.2 訓練の実施要領 ●第11章 事故を防ぐ手順書の作り方 11.1 ヒューマンエラーとは 11.2 ヒューマンエラーを防ぐ手順書の作成 ●第12章 エンドユーザ向けの情報発信 12.1 エンドユーザ向けの情報発信の目的と内容 12.2 エンドユーザ向けの情報発信の方法 ●Appendix 難易度の高いシステム障害ケース ケース1 ビジネスロジックアプリケーション障害と「誤データの波及」 ケース2 インフラ障害における機器の「半死」 ケース3 大規模インフラ障害と「伝言ゲーム」 ケース4 キャパシティ障害 ケース5 災害時のコントロール~3.11のふりかえり ■著者プロフィール 木村誠明:株式会社野村総合研究所 システムコンサルタント。金融系業務システムの開発・保守運用に携わり多くの障害対応を経験。その後、システム運用高度化のための技術開発・サービス開発を実施。現在はITサービスマネジメントの専門家として、社内外のシステム運用の改善に携わるとともに、障害対応力向上のための研修講師も手掛ける。NRI認定ITサービスマネージャー。
-
-事故への道を知り事故を避ける 実践形式で学ぶ、ヒューマンエラー防止のノウハウ。 もう、ヒューマンエラーは怖くない! ときに深刻な事故を招くヒューマンエラーは、 どのようにすれば防げるのか。 本書では、事故が発生するまでの過程だけでなく、 事故が起こる構造にも注目し、 ヒューマンエラー防止のための理論を考察する。 また、すぐに役立つ実践的なテクニックの一端を、 身近な事例などを題材に問題形式で紹介する。 ●まえがきより 事故はたった一つのきっかけだけで説明できるものではありません。 事故は、複数の要素・要因がそろった結果生じるものです。 これはちょうど、ポーカーや麻雀で役がそろって上がることに似ています。(略) 本書では事故を、最後のトドメだけではなく、 発生のしやすさの構造からも捉え直してみたいと思います。 ●目次 第1章 ヒューマンエラーとは何か 第2章 なぜ事故は起こるのか 第3章 ヒューマンエラー解決法 第4章 事故が起こる前に……ヒューマンエラー防止法 第5章 実践 ヒューマンエラー防止活動 第6章 あなただったらどう考えますか 第7章 学びとヒューマンエラー 〈増補〉第8章 安全とは誰がどう決める?