Skip to content

Latest commit

 

History

History
17 lines (11 loc) · 1.88 KB

File metadata and controls

17 lines (11 loc) · 1.88 KB

特徵縮放 Feature Scaling

Python Numpy Pandas Matplotlib Seaborn ScikitLearn

前言

在資料科學領域中,資料前處理的過程,係訓練模型前提升資料品質的關鍵步驟。特徵縮放(Feature Scaling)是資料前處理的其中一種技巧,它能幫助我們更客觀理解與比較數據,避免因為多個特徵間不同的數值範圍尺度,造成我們解讀與判斷的偏差,另外,對於一些基於距離或梯度收斂的機器學習演算法,特徵縮放也能提升模型的訓練效率,與確保模型的預測。

紅酒資料集為範例,訓練一個支援向量分類 SVC 模型,其決策邊界會受到特徵的數值範圍所影響,藉由特徵縮放的前處理手法,能有效降低不同特徵的尺度對模型的影響,請參閱下圖。

特徵縮放的介紹與 Python 實作程式碼 Open In Colab 👈

Back to 資料科學的日常研究議題