新着Pick
270Picks
Pick に失敗しました

人気 Picker
以前のAWSの障害といい、Azureの障害といい、インフラ系は人の操作、手順ミスによるものになってしまいますね。
しっかり確立された手順ならよいですが、障害対応などで想定されない手順の場合は、どうしても起こりがち。
いずれ、少なくともインフラ系はすべてが自動で修復、復旧されるようになるのでしょうね。
え?凄い人為的凡ミスを。。
コミュニケーションツールとしては優秀ですが、
インフラとしてはまだこれからなのかもしれませんね。。
誰だって間違えることはある
まあさすがにそんなに聞きませんが、あり得るミスですし、電源系のメンテナンスだったので被害が大きかったようですね。運用系の作業ミスは大規模災害に直結しますね。正直そんなにレベルの低いミスだとは思えません。ソフトで起きると分かりにくいだけで、ハードだとレベルが低く見えるだけで同じヒューマンエラーです。ソフトウェアの方がレベル低いミスを隠しやすいんですよね、専門用語重ねれば笑 現場の人は大変だろうな、お疲れ様です。
LINEなので、メッセージが届かない…ですみますが、これが5G通信に依存した自動運転だったら、どうなったでしょうか…

こういった、普通で考えては起こり得ない人為的なミスがあるのがインフラです。

人命に関係する部分では、ネットから切り離された状態でも、エッジ側で安全に対応できる設計にすることの重要性を改めて実感できる記事です。

※個人的な見解であり、所属する会社、組織とは全く関係ありません
LINEの通信障害の原因は外部のメンテナンス会社が電源設備を誤って停止してしまったとのこと。
外部の人員が出来る操作で、電源を落とせてしまうんですね。詳細は解りませんが、会社のコアになる部分なので、パスワードがないと電源を落とせないとか、何かブロック手段はありそうなものと思ってしまいました。
人的作業ミスを防ぐためにも、ITシステムの世界はInfrastructure as a codeといってシステムメンテナンス・運用はプログラミングで実施されるようになってきました。

こういう要の装置も早くデジタル化され、プログラムで操作されるようにならないとですね。

業界の方、頑張って下さい!
やはり、人為的ミスの撲滅は難しそうですね。

すべてプログラム通りに実行できるロボットであれば良いですが、人が関与する以上ゼロにするのはできないと思いますので、影響度合いをできる限り下げる方法を考える必要があると思います。
そんなことがあるんですね。
それが分かっただけでも、こちらもリスクの想定ができますね。
また、素朴なミスを、、。

業績