|
カテゴリ:本
「ポストモーテム(Postmortem)ー。
米国のIT企業は、システム障害が発生した後に 社内外の関係者と共有する事後検証報告書をそう呼ぶ。」 で始まる本書。 みずほ銀行のシステム障害の事後検証報告の解説書となっている。 日経コンピュータの記事がベースなので、IT技術がわかってないと、 専門用語が多いので読むのはちょっとしんどい感じ。 金融庁が指摘する真因は以下の4点 1)システムに係るリスクと専門性の軽視 2)IT現場の実態軽視 3)顧客影響に対する感度の欠如、営業現場の実態軽視 4)言うべきことをいわない、言われたことだけしかしない姿勢 1)で、リスクと表現されている、 「システム障害を前提とした訓練不足&準備不足」 が、騒ぎを大きくしている一番の原因ではないかと感じた… 大きなシステムを開発したり、運用した経験はないが、 ・バグは、絶対になくならない ・システムトラブルは、絶対になくならない。 と思っているので、 システムが大きくなればなるほど、リカバーが重要なんじゃないかな 4)については、それを前提としてシステムやルールをつくったり、 訓練や教育をしたりしないと、人に頼る組織になってしまう。 正論ではあるが、現場をわかっているのかなと、思ってしまった 規模は違えど、私も開発業なので色々と考えさせられる一冊だったかな。 2022年17冊目 期間:2022年12月4日~12月14日 題名:ポストモーテム みずほ銀行システム障害 事後検証報告 著者:日経コンピュータ 出版:日経BP (2022/3/17) 内容(出版社からのコメント) Amazon: 79,449位本 みずほ銀行で2021年2月からの12カ月間に11回ものシステム障害が発生した。 2002年、2011年と大規模システム障害を起こし、 それを反省して2019年までに勘定系システムを全面刷新したみずほ銀行だったが、 トラブルは繰り返された。 システム障害はなぜ起きたのか。 みずほ銀行ではなぜシステム障害が繰り返されるのか。 情報システムは人が開発・運用するものでトラブルは避けられないのだから、 情報システムを利用する組織には、 システム障害が起きても顧客や業務に影響を与えないで済ませられる レジリエンシー(復元性)が必要だ。 情報システムの専門誌「日経コンピュータ」が執筆する本書は、 みずほ銀行の失敗を教訓に、組織のレジリエンシーを高めるための方策を探る。 ●気になったフレーズ ・原因を特定せずに禁止条件を緩和 ⇒「原因を特定せずに過去にうまくいった対策を 影響範囲の検討もなく安易に用いたため被害が拡大」 あり、運用監視の環境があまりにも貧弱だったと続く 検討なく適用することは考えにくいので、 影響範囲を検証できるだけの人がその場にいなかったのでは… どちらにせよ、環境(体制)の問題なんだけどね。 ・積極的に声をあげることでかえって責任問題となるリスクをとるよりも、 自らの持ち場でやれることをやったいたと言えるための行動をとる方が、 組織の行動として合理的な選択になってしまう。 ⇒企業風土の問題と指摘しているが、しっくりこなかった 風土の問題ではなく、障害発生時の訓練や教育が不足していただけ、 もしくは、リーダの力量不足… ・他行は障害訓練を充実 ⇒みずほ銀行は他社ほど障害訓練を充実させてないとある。 最近、他社を知ることが、とても重要だと感じるようになった。 どうやって他社を知るか...これが課題。 感度をもったメンバーを社外に出すだけでダメで... ビジネスセンスをもったメンバーがどれだけいるかが重要 ・他行はITを駆使した情報共有の仕組みを準備 ⇒ITを駆使した情報共有の仕組みをうちも作りたい… 急速に進歩・拡大していくITシステムの開発・運用にはトラブルがつきもので、 顧客への影響をどれだけ抑えらえるか、そこに尽きると思う。 自分の事業にもこの教訓を活かしたい 次はこれ。面白そう 今年も残り2週間。 プライベートは充実していたけど、 仕事は、常に追い詰められていた感じだった… 苦労しただけ成長していると思いたい お気に入りの記事を「いいね!」で応援しよう
最終更新日
2022.12.17 17:22:43
コメント(0) | コメントを書く
[本] カテゴリの最新記事
|