「au大規模通信障害」はKDDIだけの問題ではない
コメント
注目のコメント
システム管理者にとってネットワーク輻輳は悪夢です。事実として、何も出来る事はありません。何かを切り離すと収まりますが、その後の組込みで事態は悪化する可能性があります。キャリアもTCP/IPを使うしか無いのですが、規約的にも作法的にも輻輳を調停する制御は組み込まれていません。もう手遅れかも知れませんがTCP/IPってこの先何百年も使うのか?規約を更新する必要は無いのか?またUDPの様にロス前提で組める部分はないのか?など考えてしまいます。
障害の状況がよく分かりました。
インフラは「あって当たり前」みたいに思われて障害発生時にやたらと責められがちですが、自分も情報システム部でインフラ関連にも関わっている身としては、相手の事を責められません。それどころか、「いつも本当にありがとうございます」と言いたいです。できなかったことを責めることができるのは、相手の代わりに自分が完璧にやれる自信がある人だけです。
関係者の皆さん、いつもありがとうございます。そして無事に問題が収束し、再発防止策が取られ、皆さんに平穏な日々が訪れる事を祈っています。「音声通話サービスを行うために、加入者DBを管理する装置(PWG)はその情報をVoLTE交換機に送っている。ところが輻輳が発生しているため、加入者DBの情報をVoLTE交換機に送っても応答せず、ここでも輻輳が発生していたという。
(中略)
なぜなら加入者DBの内容が、完全には同期されない状態になってしまっていたからだ。」
固定IP電話は移動しないがスマホは次々と基地局エリアを移る。交換機からスマホにたどり着くまでのルート情報を常に同期しなければ通信が繋がらない。しかし移動した一部スマホの同期が輻輳により崩れ、エラー通信量が指数関数的に増加したのかな。
VoLTEに限らず移動体VoIP全般が抱える問題かもしれませんね。119番用に他キャリアとローミングできるようにするか、それとも小容量の3Gネットワークを残すか…スマホ側にはこの先も3Gが残りますから。