📌 互联网史上历时最长的瘫痪是怎样造成的【让编程再次伟大#48】
Original URL: https://youtu.be/ITw5hZWeAyE
📌 互联网史上历时最长的瘫痪是怎样造成的【让编程再次伟大#48】
⓵ 【容易懂 Easy Know】
想像一個很大的城市,裡面有很多很多的房子(就是我們的網站或應用程式),這些房子都需要從一個叫做 DynamoDB 的中央水塔抽水來運作。有一天,這個水塔的送水系統(一個小程式)壞掉了,就像兩個水管工人同時想去調整開關,結果反而把開關弄壞了,水塔就沒辦法供水了。雖然工人很快修好了開關,但因為水塔停了三小時,家家戶戶累積了超多的用水需求,水壓一下子衝垮了另一個很重要的水管(DWFM,負責分配電力的系統),導致城市裡所有發電機都無法啟動。
接著,管線工人又花了好多時間修好這條水管,但這時控制整個城市網路的系統(Network Manager)又因為突然湧入的大量請求而塞住了,網路交通亂七八糟。最後,連負責指揮交通的警察(NLB,流量分配器)也搞不清楚狀況。從水塔故障開始,整個城市花了超過半天的時間才完全恢復正常。這告訴我們,即使是一點點小錯誤,在一個很大很複雜的系統裡,也可能像骨牌一樣,