重大事故の時の対応について

Written by

in

元ヤフーの社長だった宮坂さんが投稿している記事。

重大事故(非常時)の対応として、必要な内容がまとまっているように思うので、健忘禄としてリンクを残す。通常のPRJを運営する上でも、参考になるエッセンスが多いと思う。

https://note.com/mmiya/n/n746eb2e36f81

2022/8/4 追記

先月、KDDI(AU)が大規模障害を起こしましたが、このエッセンスとして紹介されている10項目で見ると、”7.後方はユーザーファーストに”と”8.対外リリースも定時化”が不十分だったようい感じられます。いずれも、内向きの組織(典型的なのは役所(全部では無いですが))で有りがちな・・・・。

古い体質(KDD時代)がこんな所に出たので無ければ良いですが。

もっとも、元エンジニアとしては、障害理由の方が気になりますね。古い手順書を使ったのが悪いような発表でしたが(直接の理由はそうでしょうが)、安定が強く求められるシステムでダイナミックルーティング的な思想で設計されているのでは?と思える記載が有るのが気になります。確かに、現在はこちらが主流なので疑問を抱かないのかも知れませんが、運用(維持)には高いスキルが必要になります。レガシーな方式の方が、万が一の時に影響を拡大しないように思うのですけど。

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *