消融實驗(Ablation Study):
把模型中的某個模組、特徵、或訓練方法「移除(ablate)」或「替換掉」,再觀察模型表現如何變化。
-
如果移除後性能大幅下降,代表該部分對模型的貢獻很大。
-
如果幾乎沒變化,表示那個模組可能不是關鍵,甚至可以簡化。
📖 舉例
-
在深度學習模型中:
-
研究者可能會移除 注意力機制 (attention),只留下 CNN 或 RNN,來比較模型準確率差多少。
-
-
在特徵工程中:
-
訓練一個模型用全部特徵,再逐一去掉某些特徵,看性能下降程度,來判斷哪些特徵最重要。
-
-
在 NLP 模型中:
-
測試移除「詞向量」、「句法特徵」或「語境編碼器」後,模型在翻譯或分類上的表現是否明顯變差。
-
🔎 為什麼重要?
-
幫助 理解模型內部機制,不是只看黑箱輸出。
-
可以 減少不必要的複雜度,降低計算成本。
-
在論文或研究中,消融實驗常用來 證明某個創新模組的貢獻。例如:「我們的方法比 baseline 好,不只是因為加了更多參數,而是 attention 機制真的有幫助。」