KDDIとみずほ銀行、2つの障害に3つの類似点 根幹にある問題とは
コメント
選択しているユーザー
大規模障害という点で、多少類似点は出るはず。大企業かつ規制業界という点で、合併企業ということも含めて類似点はあるはず。そういう意味で類似点は誰が考察しても存在するのだがそれ以上に特徴的な類似点はほぼないことが逆に分かった。
技術に強いとマネジメントが弱くなるとは酷い偏見かと。それで通信大手の社長は務まらないような気もします。障害の原因や技術要素も違い過ぎて、システム目線では双方の類似点を探すのは少し無理筋のような気もするので、この記事の筆者には技術的な目線が無さそうなのはよく分かった。
注目のコメント
根幹にある問題には全く触れていないけどね。
障害発生後の情報伝達のあり方に改善の余地はあるのは共通している面もあるが、根幹の問題ではない。
KDDIの場合は、VoLTEで音声通信までデータ通信の巻き添え食っていいの?それで必要以上に大規模化に繋がったのでは?というシステム設計の根本的かつ高度なレベルの問題なのに対し、みずほ銀行はベンダーへの丸投げ体質で、新システム稼働開始後もしばらくは警戒を怠るべきでない保守運用初期期間でベンダーが手薄になって、取り組みの不味さが露呈したという問題だと見るけどね。
両者を同じレベルで捉えるのはぜんぜん違うし、流石にKDDIに失礼だろう。長い割に浅い記事。
みずほのは充分に予見出来た事を放置しただけだと思う。
システム屋の立場からすると夜中で2時間で第1報を出したのは早い方かと。
切り戻しとかリカバリ方法は用意していたんだろうけど、それ自体を戻したところで、状態が刻々と動く最中だと他に派生する事もあり中々難しい。
サービスの完全停止が可能なら割と楽だけど、常時サービスを提供しなくてはいけないからね。はい、犬の電話屋です。
技術に明るい社長がいて、端末のラインナップも独自性があって、ちょっと不思議なプランがあって、それが多くのAUファンを惹きつけているのだと思うのだけれど。技術に強ければマネジメントには明るくないのか?補集合としてそっちも有能な人もいるはずなのだけれど。むしろテクニカルに強くて理系の判断ができる経営者の方が今は求められているだろうに。
輻輳を原因とするデータの余波を受け止めるのは大変なことで、そりゃあ長い時間がかかったことは誉められたことではないですが、責任を他に任せず自ら説明して見せたのはパフォーマンスとしても良かったと思います。
それよりも今後もどこかで通信障害は起こるものとして考え、緊急時のローミングの議論を進めるべきだと思います。