kaggle開放數據衛星圖片識別棕櫚種植園比賽

Comments

訓練階段模型的輸出;訓練和驗證損失的變化過程。

色狠狠亚洲爱综合网站在你進行訓練和驗證數據集時,fast.ai 只在內部挑選并保存你的最佳模型。

評估我們的模型

色狠狠亚洲爱综合网站競賽提交的材料是根據預測概率和觀測目標 has_oilpalm 之間的 ROC 曲線來評估的。默認情況下,Fast.ai 不會附帶這個指標,所以我們將使用 scikit-learn 庫。

評估我們的模型

打印驗證指標。

使用預訓練模型和 fast.ai 的妙處在于,你可以獲得很好的預測準確率。在我們的案例中,沒有費多大力就獲得了 99.44% 的準確率。

驗證指標

訓練第一階段的指標。

色狠狠亚洲爱综合网站保存模型,并繪制關于預測的混淆矩陣。

保存模型

使用混淆矩陣查看結果


混淆矩陣查看結果

繪制混淆矩陣。

色狠狠亚洲爱综合网站與我們繪制的上一個混淆矩陣相比,你會發現模型的預測效果更好了。

混淆矩陣

第二個訓練階段的混淆指標

之前有 7 張不含油棕種植園的圖像被錯誤分類,現在降到了 3 張,這就是進步。

我們在訓練和調參期間遵循了一種模式。大多數深度學習實驗都遵循類似的迭代模式。

圖像轉換

我們將在數據上執行更多的圖像轉換,這應該是能提升模型效果的。圖像轉換的具體描述可以在 fast.ai 文檔中找到:

圖像轉換

應用不同的轉換以提升模型效果

max_lighting:如果超參不為 None,那么以 p_lighting 為概率隨機進行亮度、對比度的調整,且最大亮度不超過 max_lighting。

色狠狠亚洲爱综合网站max_zoom:如果超參不小于 1,那么以 p_affine 為概率隨機放大 1 到 max_zoom 倍。

色狠狠亚洲爱综合网站max_warp:如果超參不為 None,那么以 p_affine 為概率在-max_warp 和 max_warp 之間隨機對稱變換。

我們再一次搜索最優學習率:

搜索最優學習率

?

搜索一個合理的學習率

找到理想學習率

找到理想的學習率

色狠狠亚洲爱综合网站以 1e-4 的學習率訓練 5 個 epoch 以擬合模型。

?

5 個 epoch 以擬合模型

以 1e-4 的學習率對模型訓練 5 個周期

?

5個周期

訓練和驗證損失

觀察訓練指標并與之前的指標對比。我們的模型有了小小的提升(損失從 0.169 降到了 0.168)。

2個epoch最佳模型

模型訓練階段的輸出。在第 2 個 epoch 時得到最佳模型

保存模型最后的訓練階段并打印出指標。

保存模型后訓練指標

?

打印指標

準確率、誤差率和 AUC 分數

如下所示,模型的準確率為 99.44%,優于上一個訓練階段 99.38% 的準確率。

準確率

第四個訓練階段的指標

準備一個競賽提交文件

現在可以看到我們的模型對未見過的數據做出了多么好的預測。

預測結果 訓練

準備一個 CSV 提交文件

將文件提交給 WiDS Datathon

你仍然可以參加 WiDS 競賽并晚一點提交。進入參賽頁面,點擊「Join Competition」,了解比賽規則。現在你可以提交作品,看看自己會排到第幾。

結果

根據模型預測對提交的作品進行打分?


原文鏈接:https://towardsdatascience.com/how-a-team-of-deep-learning-newbies-came-3rd-place-in-a-kaggle-contest-644adcc143c8?

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?44d5929b98ed1fd093ffc3d47ec712b9"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); document.writeln("");