新着Pick
279Picks
Pick に失敗しました

人気 Picker
とにかく明日朝、無事システムがワークすることを心から願うばかりです…

そして今後は、万一の場合名古屋や福岡など、別の取引所にリプレイスできるような一部分散型のシステムにできるよう、工夫をお願いしたいものです。
内容は知りませんが。
想定してない障害で止まるって事はそんなに珍しい事では無い。

通常は1つの障害で止まる様な設計では無い。
しかし、いくつかの要因が重なると停止する。

例えば、以下の例。
HPのSSDストレージシステムが32,768時間を超えるとデータが消滅するって恐ろしい話。

https://pc.watch.impress.co.jp/docs/news/1222207.html

コレ、HPが悪い訳じゃなく、供給してるSSDベンダーが悪い。

でね、ファームウェア更新で修正されるんですけど、ストレージサーバーやSSDのファームウェア更新ってなかなかできないんですよ。
データが飛ぶ可能性はかなり高いから、全データバックアップ取らないとだし、全システム停止しないと更新できない。

なもんで、今問題になってないなら「計画メンテ時にやるか」となるんですよ。普通。

でね、ここで重要なのは、上記問題は運転時間で死ぬんです。

つまり、同じストレージで冗長化してたとしても、両方同時に死ぬんです。

コレで共有ストレージ構成していたらアウトです。
HDDストレージの様な偶発故障や物理的故障が前提の冗長化構成だと、意味がない。

とは言え、当然それも想定して、HDDなど別のストレージにもバックアップしていたと思うんです。

ただ、SSDとHDDだと読み書き能力の桁が違う。
なので、既に多くの処理トランザクションが発生していたら、HDDじゃ追いつかないんです。
バックアップから復元なら1日作業でしょう。

上記SSDベンダーが富士通にも供給してる可能性は高い。
昨年システム更新してるそうですが、共有ストレージはそのタイミングとは別で更新計画してるかも。

富士通はストレージファームウェア更新提案を東証にしたけど、東証に断られたかも。

そんな背景があるんじゃないか。
そう考えると、富士通だけを責める事はできないです。

実際のとこは知りませんけどね。
記者の質問レベルが低すぎる。東証トップの会見がしっかりしていただけに余計目立った。
Sakakibaraさんのコメントが分かりやすい(有難うございます!)。
インフラを担うシステムは、障害が起こらないようにだけでなく、障害が起こっても運用できるように、冗長設計やステップが作られている。ただ、それでもたまにフェイルオーバーに失敗して、大きな事態になる。
最近だと昨年のAWSの障害もこういうのの連鎖。実生活では、東証よりAWSやGoogleの障害の方が厳しい今日この頃。
https://japan.zdnet.com/article/35141745/
丸一日落としてしまった影響は計り知れません。
謝って済むレベルじゃない。

が、1人の金融エンジニアとしては拍手したいです。
こんなCIOならついていきたいです。
即座に取引中止を決めたのは大変大きいと思います。


東証のシステムって、わかっていればわかっているほど担当したくないシステムです。
要求速度が尋常でない上に(GWで受付してから約定結果返却トランザクションGW通過まで0.2ms、これが1日数億〜数十億トランザクション)、負荷分散APサーバ郡に加えて冗長構成のオンメモリDBサーバ郡ってだけで気が狂いそうな構成です。

クラウドだなんだと言いますが、ここまで変態仕様なシステムはクラウドではかなりきついと思います。SLAがどんなものかわかりませんが。

事前のテストって観点からすると、全く同じ構成のシステムを本番系と開発系で持っていてテストを行えるとかならこういう時の場合もやり切れるとは思うのですが、単純にお金が倍以上かかりますね...。
しかもお金積むだけでなく腕利き達じゃないと太刀打ちできないです。


一部のコメントに反論する形になりますが、現にawsもazureもiCloudもパタパタ落ちてますので、僕が担当者ならこういったミッションクリティカルなシステムは載せられないですね。ハードも含めて全て見るべきです。

擁護はできませんが、応援しています。
無事に明日、売買が再開できるようになったようです。良かった!
リリースも出ています
https://www.jpx.co.jp/news/1030/20201001-09.html
丸一日取引を止めてしまって、原因も対策も説明しない、できないでは、参加者の不安を拭えません。世界の主要市場として存続するためにも、しっかり対応いただきたく。
よかったー
下げから始まるんですかね
そして富士通は下がるのかなー

ニュース見るよりここのコメント欄見てる方が
質の高い正確な情報をもらえる。
仕組みの分散、取引の分散
トラブルが全く起こらないシステムというのは、難しく、
止まらないを前提ということに、問題点あるとおもいます。
ひとまずよかった。