CLASSROOM LAB

機器學習 vs 傳統統計

FINANCE CASE
任務:
傳統統計:邏輯迴歸(Logistic Regression 主效果參數模型(main effects)。主要看係數方向、顯著性、信賴區間。
機器學習:隨機森林式樹集成(Random Forest-style Tree Ensemble 多棵決策樹集成。主要看預測表現與泛化。
CREDIT CASE 簡單案例:信用卡客戶是否在 12 個月內違約。主要因子:月收入、負債比、信用分數、近期逾期次數。

傳統統計

模型:Logistic Regression主效果

  • 主要重點在「因子」與解釋
  • 專注 X 與 Y 之間的關係
  • 小樣本、少量變數
  • 使用 P 值與信賴區間
  • 目的:描述與推論
訓練分數 (Train Score, AUC)0%
驗證分數 (Validation Score, AUC)0%
Top-Decile Capture Rate (Top 10%)0%
Generalization Gap (Train-Valid)0%
邏輯迴歸摘要 (Logistic Regression Summary)
因子 β OR p-value 95% CI (OR)
...
重點摘要 ...
樣本數 (N) 0
顯著因子數 (p<0.05) 0

機器學習

模型:Random Forest-style Tree Ensemble

訓練分數 (Train Score, AUC)0%
驗證分數 (Validation Score, AUC)0%
Top-Decile Capture Rate (Top 10%)0%
Generalization Gap (Train-Valid)0%
成效差距:
資料視覺化
資料點 統計模型線 ML 模型線
白線:統計模型 綠線:ML