尤物色视频网站在线观看,麻豆一二三区AV传媒,卡一卡二卡三网站

測量模型不確定性的兩種簡單方法

2022-02-07 15:49

在本文中，我們將介紹兩種方法，它們允許你獲得模型的不確定性：蒙特卡羅Dropout法（MC Dropout）和深度集成法。

它們適用于各種各樣的任務，但在本文中，我們將展示一個圖像分類的示例。它們都相對容易理解和實現(xiàn)，都可以很容易地應用于任何現(xiàn)有的卷積神經(jīng)網(wǎng)絡架構(gòu)（例如ResNet、VGG、RegNet等）。為了幫助你快速輕松地應用這些技術(shù)，我將提供用PyTorch編寫的這些技術(shù)的補充代碼。給出兩個杯子的圖像，你的預測模型有多確定？

在我們開始之前，讓我們回顧一下測量模型不確定性意味著什么，以及它如何對你的機器學習項目有用。

什么是模型不確定性？

就像人類一樣，機器學習模型可以對其預測顯示一定程度的信心。一般來說，在討論模型不確定性時，需要區(qū)分了認知不確定性和任意不確定性。認知不確定性是在模型參數(shù)中表示的不確定性。這種類型的不確定性可以通過額外的訓練數(shù)據(jù)來減少，因此具有“可減少的不確定性”的替代名稱。任意不確定性捕獲環(huán)境固有的噪聲，即觀測。與認知不確定性相比，這種類型的不確定性不能用更多的數(shù)據(jù)來減少，而是用更精確的傳感器輸出來減少。第三種類型稱為預測不確定性，即模型輸出中傳遞的不確定性。預測不確定性可以結(jié)合認知不確定性和任意不確定性。

分類器的softmax輸出示例：

如果你自己已經(jīng)訓練過簡單的神經(jīng)網(wǎng)絡，那么最直觀的想法就是模型的softmax輸出，即你經(jīng)�？吹降淖鳛槟Ｐ皖A測結(jié)果顯示的百分比值。

但是，使用softmax輸出作為模型不確定性的度量可能會產(chǎn)生誤導，并且不是很有用。這是因為softmax函數(shù)所做的只是計算模型不同激活值之間的某種“關(guān)系”。

因此，你的模型可以在其輸出層的所有神經(jīng)元中具有較低的激活值，并且仍然達到較高的softmax值。這不是我們的目標。但值得慶幸的是，有多種更有效的技術(shù)來估計模型的不確定性，如蒙特卡羅Dropout和深度集成。

為什么模型不確定性有用？

有兩個主要方面使評估模型的不確定性變得有用：

首先是透明度。假設你正在構(gòu)建一個應用于醫(yī)學圖像分析的機器學習模型。因此，使用你的工具的醫(yī)生在很大程度上依賴于其做出正確診斷的能力。

如果你的模型現(xiàn)在做出了一個預測，它實際上是高度不確定的，但確實將此信息傳達給了醫(yī)生，那么對患者治療的后果可能是致命的。因此，對模型的不確定性進行估計可以在很大程度上幫助醫(yī)生判斷模型的預測。

第二是顯示出改進的空間。沒有一種機器學習模型是完美的。因此，了解模型的不確定性和弱點實際上可以告訴你需要對模型進行哪些改進。

實際上，有一門完整的學科專門研究這門學科，叫做主動學習。假設你已經(jīng)用1000張圖片和10個類訓練了你的ConvNet。但你仍然有9000多張尚未標記的圖像。如果你現(xiàn)在使用經(jīng)過訓練的模型來預測哪些圖像是最不確定的，則標記這些圖像并重新訓練模型。結(jié)果表明，與這些圖像的隨機抽樣相比，這種不確定性抽樣對模型改進更有效。

好了，讓我們來討論這兩種技術(shù)。

技巧1：蒙特卡羅Dropout

Monte Carlo Dropout，簡稱MC Dropout，是一種在模型中使用Dropout層來創(chuàng)建模型輸出變化的技術(shù)。

應用于神經(jīng)網(wǎng)絡的Dropout可視化。

Dropout層通常在訓練期間用作正則化技術(shù)。在向前通過網(wǎng)絡的過程中，某些神經(jīng)元以一定的概率隨機為0。這表明，該模型具有更強的抗過擬合能力。通常，為了不干擾新圖像的前向傳遞，在訓練后禁用這些Dropout層。所以，要使用這種技術(shù)，請確保在你的模型中至少實現(xiàn)一個Dropout層。這可能看起來像這樣。