関連記事一覧
東証 システムトラブル 宮原社長らが陳謝 2日の売買再開へ準備
NHKニュース 716Picks
東証などに「報告徴求命令」 金融庁 システムトラブルで
NHKニュース 245Picks
東証 通常どおり売買 システムは正常
NHKニュース 145Picks
東証、一時2万7400円超え 30年4カ月ぶりの高値
共同通信 139Picks
東証トラブル 基幹システム手がける富士通社長が陳謝
NHKニュース 132Picks
東京証券取引所 午前9時から売買再開と発表
NHKニュース 117Picks
東証トラブル 金融庁業務改善命令へ 経営陣厳しい判断迫られる
NHKニュース 72Picks
東証で8カ月ぶりに新規上場の鐘 コロナ対策徹底し式典再開
共同通信 16Picks
東証 宮原社長が記者会見でトラブルについて説明へ
NHKニュース 8Picks
下半期「スタート日」に東証システム障害、終日売買停止の「失敗」の意味
Forbes JAPAN 6Picks
そして今後は、万一の場合名古屋や福岡など、別の取引所にリプレイスできるような一部分散型のシステムにできるよう、工夫をお願いしたいものです。
想定してない障害で止まるって事はそんなに珍しい事では無い。
通常は1つの障害で止まる様な設計では無い。
しかし、いくつかの要因が重なると停止する。
例えば、以下の例。
HPのSSDストレージシステムが32,768時間を超えるとデータが消滅するって恐ろしい話。
https://pc.watch.impress.co.jp/docs/news/1222207.html
コレ、HPが悪い訳じゃなく、供給してるSSDベンダーが悪い。
でね、ファームウェア更新で修正されるんですけど、ストレージサーバーやSSDのファームウェア更新ってなかなかできないんですよ。
データが飛ぶ可能性はかなり高いから、全データバックアップ取らないとだし、全システム停止しないと更新できない。
なもんで、今問題になってないなら「計画メンテ時にやるか」となるんですよ。普通。
でね、ここで重要なのは、上記問題は運転時間で死ぬんです。
つまり、同じストレージで冗長化してたとしても、両方同時に死ぬんです。
コレで共有ストレージ構成していたらアウトです。
HDDストレージの様な偶発故障や物理的故障が前提の冗長化構成だと、意味がない。
とは言え、当然それも想定して、HDDなど別のストレージにもバックアップしていたと思うんです。
ただ、SSDとHDDだと読み書き能力の桁が違う。
なので、既に多くの処理トランザクションが発生していたら、HDDじゃ追いつかないんです。
バックアップから復元なら1日作業でしょう。
上記SSDベンダーが富士通にも供給してる可能性は高い。
昨年システム更新してるそうですが、共有ストレージはそのタイミングとは別で更新計画してるかも。
富士通はストレージファームウェア更新提案を東証にしたけど、東証に断られたかも。
そんな背景があるんじゃないか。
そう考えると、富士通だけを責める事はできないです。
実際のとこは知りませんけどね。
インフラを担うシステムは、障害が起こらないようにだけでなく、障害が起こっても運用できるように、冗長設計やステップが作られている。ただ、それでもたまにフェイルオーバーに失敗して、大きな事態になる。
最近だと昨年のAWSの障害もこういうのの連鎖。実生活では、東証よりAWSやGoogleの障害の方が厳しい今日この頃。
https://japan.zdnet.com/article/35141745/
リリースも出ています
https://www.jpx.co.jp/news/1030/20201001-09.html
障害対応でも経営陣が具体的かつ真摯に対応することが重要。