[Day29]機器學習:交叉驗證! | 就愛喝咖啡
![[Day29]機器學習:交叉驗證!](https://i.imgur.com/B2oemyF.jpg)
接下來要來看一下怎麼使用python做交叉驗證!引入.首先,我們將會用到的函數庫引入:fromsklearn.cross_validationimportcross_val_score.cross_val_score ...
![[Day29]機器學習:交叉驗證!](https://i.imgur.com/B2oemyF.jpg)
倒數第二天!
今天要來看機器學習中很重要的交叉驗證(Cross validation):
一般來說我們會將數據分為兩個部分,一部分用來訓練,一部分用來測試,交叉驗證是一種統計學上將樣本切割成多個小子集的做測試與訓練。
交叉驗證主要分為以下幾類:
k-folder cross-vailation kk folder cross-vaildation least-one-out cross-validation 10-fold corss validation如果想要知道更多關於上述交叉驗證法的優缺點可以到:機器學習中的交叉驗證cross-validation[1]
為什麼需要交叉驗證為了避免依賴某一特定的訓練和測試資料產生偏差。
which is intended to avoid the possible bias introduced by relying on any one particular division into test and train components, is to partition the original set in several different ways and to compute an average score over the different partitions.
一個更好的方式是把原始資料按不同的方法分,計算不同部分的平均得分。
誇張點來說,我們都只有用一部分特定的測試資料去測試我們訓練的結果,假設剛好那一部分測試資料剛好百分之百一樣,而其他部分剛好都不準確,我們就以為這個訓練結果是百分之百的。
交叉驗證怎麼做?K-Fold Cross Validation is used...