缺乏訓練樣本醫(yī)療AI“喂不飽”?騰訊優(yōu)圖實驗室想了這兩個辦法
“醫(yī)學影像本質上是一個圖像識別問題,面臨的最大挑戰(zhàn)是小樣本學習的問題。”
5月30日-6月2日,由中國醫(yī)師協會、中國醫(yī)師協會放射醫(yī)師分會主辦,廣東省人民醫(yī)院及廣東省醫(yī)師協會放射醫(yī)師分會承辦的“中國醫(yī)師協會第十三次放射醫(yī)師年會”在廣州召開,這也是中國放射學界最高級別的會議之一,影像組學與醫(yī)學影像人工智能領域的跨界融合是這次會議的重要議題之一。
騰訊優(yōu)圖實驗室醫(yī)療AI總監(jiān)鄭冶楓博士受邀出席,并進行題為“深度學習在醫(yī)學影像分析上的應用”的主題分享,分享優(yōu)圖實驗室通過遷移學習和計算機合成圖像兩大方法,突破醫(yī)療AI數據量不足,沒有辦法像傳統(tǒng)機器學習那樣用大數據進行喂哺的問題。
鄭冶楓博士在中國醫(yī)師協會第十三次放射醫(yī)師年會上做主題演講
騰訊優(yōu)圖實驗室是騰訊頂級人工智能實驗室之一,專注于在人臉、圖像、視頻、醫(yī)療影像等領域開展技術研究。騰訊首款將人工智能技術運用在醫(yī)學領域的產品“騰訊覓影”,即是由騰訊醫(yī)療健康事業(yè)部牽頭,優(yōu)圖實驗室提供的算法支持。
醫(yī)療AI面臨“雙重挑戰(zhàn)”
當前人工智能技術的迅猛發(fā)展,與強大的計算能力、合理的優(yōu)化算法和高質量的大數據密切相關。要讓機器像人類那樣思考,成為醫(yī)生的得力助手,就必須“喂”給它大量的數據,幫助它從中找出規(guī)律。但是,在醫(yī)療人工智能領域,這一切卻沒有這么簡單。鄭冶楓博士提到,近年來,深度學習在包括圖像識別、游戲、語音識別、自然語言處理等方面取得了重大發(fā)展。但是,醫(yī)療AI的發(fā)展卻面臨“雙重挑戰(zhàn)”。
一是缺乏訓練樣本。鄭冶楓博士表示,“深度學習的目標是盡量端對端,圖像進去、結果出來,因而網絡越來越大,越來越多層,需要的訓練樣本也越來越多。”但與自然場景下自然圖像獲取不同,醫(yī)學影像的獲取十分艱難。一方面,患者對于個人的就醫(yī)隱私要更為重視,醫(yī)學圖像幾乎不會上網和共享;另一方面,圖像采集的“高門檻性”也制約著訓練樣本的獲取!搬t(yī)學影像采集需要專門的設備,有一些設備非常昂貴,比如CT和核磁!蓖瑫r,疾病本身的特殊性也對算法工程師獲取樣本造成阻礙,鄭冶楓博士表示,“對于一些罕見病種,能夠找到的圖像就只有幾百張或者一千來張,因為每年的發(fā)病量就那么多!
二是缺乏標注。鄭冶楓博士介紹道,對于自然圖像來講,其標定相對容易,即便是普通人也能夠直接標注。但醫(yī)學影像不同,其標注需要行業(yè)頂尖的專業(yè)醫(yī)生參與!艾F實是,培養(yǎng)一個醫(yī)生需要十年時間甚至很長,加上臨床、科研任務重,做數據標注對于醫(yī)生來說也是‘有心無力’!
兩大方法突破醫(yī)療AI小樣本學習問題
缺乏訓練樣本、缺乏標注這兩大挑戰(zhàn)讓深度學習“彈藥不足”,由此衍生出的“小樣本學習”問題一定程度上阻礙了AI醫(yī)學影像的發(fā)展。鄭冶楓博士提出,有兩種方法有助于解決這一問題:一是遷移學習;二是計算機合成圖像,比如生成對抗網絡。
在介紹遷移學習的概念時,鄭冶楓博士用了一個生動的比喻:“比如說一個人去森林里找老虎,但從來沒有見過老虎,不知道老虎長什么樣。但假如他可以把貓和狗、狐貍等其他動物區(qū)分開來,就可以先訓練他去找貓,這就是預訓練的過程。接下去,我們告訴對方:老虎就是黃色的貓放大100倍,從而達到‘找老虎’這個目的。”他強調,遷移學習非常適用于解決小樣本的訓練問題。
另一個方法則是計算機合成圖像。鄭冶楓博士表示,通過影像跨模態(tài)轉換,計算機合成圖像能夠有效補充訓練樣本,而生成對抗網絡則讓訓練如虎添翼:一個網絡生成圖像,一個網絡鑒別目標的真?zhèn)危褍蓚網絡做一些聯合訓練。訓練結束時,生成網絡可以產生非常逼真的圖像。鄭冶楓博士以肝癌為例,“有時候跨模態(tài)生成的圖像會扭曲,會生成一些新的病灶,也可能遺漏一些病灶,為此,我們在研究過程中會加上各類限制,減少生成圖像的失真。我們的算法很完美地保留了器官和病灶的形狀,是在用非常真實的圖像作為訓練任務,通過這種方法,能夠讓準確率得到明顯的提升!
“騰訊覓影”能精確定位3mm以上的微小肺結節(jié),檢出率≥95%
醫(yī)療AI逐步落地 提升診斷準確率和效率
通過遷移學習、計算機合成圖像等方法,影像診斷領域的深度學習取得了顯著進展。以肺結節(jié)檢測為例,鄭冶楓博士介紹道,目前肺結節(jié)檢查方式主要是肺部CT,隨著薄層低劑量CT的應用,圖像數量的倍增、小結節(jié)顯示率的提高及結節(jié)的定量測量等使得讀片的難度顯著增加,同時,繁重、枯燥的閱片工作使影像科醫(yī)師的疲勞度增加,漏診、誤診的風險也在增加。
人工智能的運用,使得這些問題逐步得到解決。經過不斷地迭代和更新,“騰訊覓影”早期肺癌篩查AI系統(tǒng)采用了騰訊優(yōu)圖實驗室的“端到端肺癌輔助診斷技術”,能夠精準定位微小結節(jié)位置和輔助醫(yī)生準確判斷患者患有肺癌的風險。預處理模塊、檢測與識別模塊是這一系統(tǒng)的核心算法。前者利用肺部的三維分割和重建算法,可以處理不同CT成像設備在不同成像參數條件下產生的不同源數據。而后者采用了“深度學習領域最好的分割算法”——全卷積神經網絡,可以實現早期肺結節(jié)檢測和分割。鄭冶楓博士表示,全卷積神經網絡有兩部分,一部分是編碼器,把圖像不斷卷積和下采樣,最后壓縮到低維空間,這是不同任務可以共享的。一部分是解碼器,不斷卷積和上采樣,最后輸出一個輸入圖像大小一樣的分割結果,這部分是每個任務獨有的。我們預訓練的編碼器會把所有任務的圖像都看一遍,因此訓練得非常好。”
“把編碼器訓練好之后,就將其遷移到其它任務,如肺部分割和肺結節(jié)良惡性判斷上。采用公開數據集,發(fā)現不僅僅分割可以做得很好,分類也可以做得很好。”鄭冶楓博士強調,“在醫(yī)療AI上,技術方面大部分工作都差不多,最后的競爭還是在細節(jié)方面。比如在良惡性的判斷上,騰訊提出了Med3D預訓練模型,該模型采用多個公開競賽數據集進行訓練。通過選取三維醫(yī)學影像進行圖像分割任務,并對這些數據進行抓取、收集,預訓練一個模型,能夠大幅提高分割和分類的準確率,解決了大部分結節(jié)不活檢,不知道良惡性的問題!
據了解,目前,“騰訊覓影” 通過人工智能醫(yī)學圖像分析能力輔助醫(yī)生閱片,已經能精確定位3mm以上的微小肺結節(jié),檢出率≥95%。同時,除早期肺癌外,“騰訊覓影”還能利用AI醫(yī)學影像分析輔助臨床醫(yī)生篩查早期食管癌、眼底疾病、結直腸腫瘤、宮頸癌、乳腺腫瘤等疾病。
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
10 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市