📌 深度解读Cloudflare故障,怎么出问题的老是你?【让编程再次伟大#49】
Original URL: https://youtu.be/T14klX5K6mQ
📌 深度解读Cloudflare故障,怎么出问题的老是你?【让编程再次伟大#49】
想像網路是一個巨大的購物中心,Cloudflare就是守在門口檢查有沒有壞人(機器人)的保安。保安系統(Bot Management,簡稱BM)每隔幾分鐘就要更新一份「壞人名單」。某天,工程師在更新資料庫權限時,沒有寫清楚資料來源,導致保安系統拿到了一份「重複又太長」的錯誤名單。這個名單一拿到,保安系統立刻當機,因為它的程式碼沒有準備好處理這麼長的資料。這就像保安拿到一本錯誤的通緝名單後,不只沒抓到壞人,還把整個商場的大門鎖死,造成所有來訪的客人(網路請求)都被擋在門外,無法進入,讓全球主要的網站癱瘓了五個多小時。這證明了,即使是最厲害、最複雜的網路系統,也會因為一個看似微小的程式碼疏忽而導致全球性的大崩潰。
-----
總結 Overall Summary
2025年11月18日,全球最大的內容分發網路(CDN)服務商Cloudflare遭遇了長達五個半小時的歷史性故障,導致包括GPT和推特在內的大量頂級