在資料科學領域中,資料前處理的過程,係訓練模型前提升資料品質的關鍵步驟。特徵縮放(Feature Scaling)是資料前處理的其中一種技巧,它能幫助我們更客觀理解與比較數據,避免因為多個特徵間不同的數值範圍尺度,造成我們解讀與判斷的偏差,另外,對於一些基於距離或梯度收斂的機器學習演算法,特徵縮放也能提升模型的訓練效率,與確保模型的預測。
以紅酒資料集為範例,訓練一個支援向量分類 SVC 模型,其決策邊界會受到特徵的數值範圍所影響,藉由特徵縮放的前處理手法,能有效降低不同特徵的尺度對模型的影響,請參閱下圖。
Back to 資料科學的日常研究議題