一文讀懂什么是知識(shí)蒸餾
前言:
知識(shí)蒸餾是一種在繁瑣的模型中提煉知識(shí)并將其壓縮為單個(gè)模型的方法,以便可以將其部署到實(shí)際應(yīng)用中。AI的教父Geoffrey Hinton和他在Google的兩個(gè)同事Oriol Vinyals和Jeff Dean于2015年引入了知識(shí)蒸餾。
知識(shí)蒸餾是指將笨拙的模型(教師)的學(xué)習(xí)行為轉(zhuǎn)移到較小的模型(學(xué)生),其中,教師產(chǎn)生的輸出被用作訓(xùn)練學(xué)生的“軟目標(biāo)”。通過(guò)應(yīng)用此方法,作者發(fā)現(xiàn)他們?cè)贛NIST數(shù)據(jù)集上取得了令人驚訝的結(jié)果,并表明通過(guò)將模型集成中的知識(shí)提取到單個(gè)模型中可以獲得顯著的改進(jìn)。
更多內(nèi)容請(qǐng)關(guān)注公眾號(hào)CV技術(shù)指南,專注于計(jì)算機(jī)視覺的技術(shù)總結(jié),最新技術(shù)跟蹤。
知識(shí)蒸餾用于圖像分類
Hinton和他的兩位合著者在論文中首先介紹了他們對(duì)圖像分類任務(wù)的知識(shí)蒸餾:在神經(jīng)網(wǎng)絡(luò)中提煉知識(shí)。
如本文所述,知識(shí)蒸餾的最簡(jiǎn)單形式是在具有軟目標(biāo)分布的傳遞集上訓(xùn)練蒸餾模型。到目前為止,我們應(yīng)該知道有兩個(gè)目標(biāo)用于訓(xùn)練學(xué)生模型。一個(gè)是正確的標(biāo)簽(硬目標(biāo)),另一個(gè)是從教師網(wǎng)絡(luò)生成的軟標(biāo)簽(軟目標(biāo))。
因此,目標(biāo)函數(shù)是兩個(gè)不同目標(biāo)函數(shù)的加權(quán)平均值。 第一個(gè)目標(biāo)函數(shù)是學(xué)生預(yù)測(cè)和軟目標(biāo)之間的交叉熵?fù)p失,第二個(gè)目標(biāo)函數(shù)是學(xué)生輸出和正確標(biāo)簽之間的交叉熵?fù)p失。 作者還提到,最好的結(jié)果通常是通過(guò)在第二目標(biāo)函數(shù)上使用較低的權(quán)重來(lái)獲得的。
實(shí)驗(yàn)結(jié)果如下所示
知識(shí)蒸餾用于目標(biāo)檢測(cè)
Guobin Chen和他的合著者在NeurIPS 2017中發(fā)表了他們的知識(shí)蒸餾與提示學(xué)習(xí)相結(jié)合的對(duì)象檢測(cè)研究,該論文通過(guò)知識(shí)蒸餾學(xué)習(xí)有效的對(duì)象檢測(cè)模型。
在他們的方法中,他們還使用提示,該提示是從教師的中間層獲得的特征圖,用于指導(dǎo)學(xué)生盡可能地了解教師的行為。 此外,為了實(shí)現(xiàn)最佳的蒸餾知識(shí),必須有一個(gè)適應(yīng)層,該適應(yīng)層將在后面討論。 Faster-RCNN是本文實(shí)驗(yàn)中使用的目標(biāo)檢測(cè)網(wǎng)絡(luò)。他們的學(xué)習(xí)方案如下圖所示:
目標(biāo)函數(shù)如下:
其中RCN和RPN分別代表回歸分類網(wǎng)絡(luò)和區(qū)域提議網(wǎng)絡(luò);N和M分別是RCN和RPN的批量大小;L_RCN,L_RPN和L_Hint分別是RCN,RPN和提示的損失;λ(通常為1)和γ(通常設(shè)置為0.5)是用于控制最終損耗的超參數(shù)。
Hint learning
Adriana Romero在《FitNets: Hints for Thin Deep Nets》一文中證明,通過(guò)利用教師網(wǎng)絡(luò)的中間表示作為提示來(lái)幫助學(xué)生進(jìn)行訓(xùn)練,可以提高學(xué)生網(wǎng)絡(luò)的性能。從這個(gè)意義上講,提示特征Z(從教師的中間層獲得的特征圖)和引導(dǎo)特征V(學(xué)生的中間層的特征圖)之間的損失是使用L1或L2距離計(jì)算的。
下圖顯示了從在WAYMO數(shù)據(jù)集上訓(xùn)練的預(yù)訓(xùn)練YOLOv4模型中提取的特征圖,這是我的與知識(shí)蒸餾進(jìn)行目標(biāo)檢測(cè)有關(guān)的項(xiàng)目之一。 在這些示例中,輸入圖像的大小調(diào)整為800x800。
知識(shí)蒸餾和提示學(xué)習(xí)
Hint learning的使用要求提示功能和引導(dǎo)功能應(yīng)具有相同的形狀(高度x寬度x通道)。同樣,提示特征和引導(dǎo)特征將永遠(yuǎn)不會(huì)在相似的特征空間中,因此,使用自適應(yīng)層(通常是1x1卷積層)來(lái)幫助改善知識(shí)從教師到學(xué)生的轉(zhuǎn)移。
下圖描述了我在目標(biāo)檢測(cè)項(xiàng)目中正在研究的學(xué)習(xí)方案,其中,我正在使用一個(gè)具有三個(gè)檢測(cè)級(jí)別的小型網(wǎng)絡(luò),從預(yù)先訓(xùn)練的YOLOv4中提取知識(shí)。
Guobin Chen在將知識(shí)蒸餾與Hint learning相結(jié)合進(jìn)行目標(biāo)檢測(cè)時(shí)顯示出優(yōu)異的結(jié)果。
Conclusion
在這篇文章中,我簡(jiǎn)要介紹了知識(shí)蒸餾和Hint learning。知識(shí)蒸餾被認(rèn)為是一種將繁瑣的模型集成知識(shí)轉(zhuǎn)換成較小的蒸餾模型的有效方法。Hint learning和知識(shí)蒸餾的結(jié)合是提高神經(jīng)網(wǎng)絡(luò)性能的一種非常強(qiáng)大的方案。
本文來(lái)源于公眾號(hào)CV技術(shù)指南的論文分享系列,更多內(nèi)容請(qǐng)掃描文末二維碼關(guān)注公眾號(hào)。
最近把公眾號(hào)(CV技術(shù)指南)所有的技術(shù)總結(jié)打包成了一個(gè)pdf,在公眾號(hào)中回復(fù)關(guān)鍵字“技術(shù)總結(jié)”可獲取。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市