侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

“深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)”發(fā)布!AI要拿三類(lèi)證,這幾點(diǎn)做好了嗎?

動(dòng)脈網(wǎng)獲悉,2019年6月29日,國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心發(fā)布了《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審批要點(diǎn)》,為相應(yīng)醫(yī)療器械軟件注冊(cè)申報(bào)提供專(zhuān)業(yè)建議。(下簡(jiǎn)稱(chēng)《要點(diǎn)》)

據(jù)動(dòng)脈網(wǎng)了解,《要點(diǎn)》主要由五部分組成:

一、適用范圍;

二、審批關(guān)注要點(diǎn);

三、軟件更新;

四、相關(guān)技術(shù)考量;

五、注冊(cè)申報(bào)資料說(shuō)明。

以下為動(dòng)脈網(wǎng)整理的《要點(diǎn)》中的關(guān)鍵詞:

關(guān)鍵詞一:適用范圍

深度學(xué)習(xí)輔助決策醫(yī)療器械軟件即基于醫(yī)療器械數(shù)據(jù)(醫(yī)療器械所生成的醫(yī)學(xué)圖像、醫(yī)學(xué)數(shù)據(jù),以下統(tǒng)稱(chēng)數(shù)據(jù)),使用深度學(xué)習(xí)技術(shù)進(jìn)行輔助決策的軟件。

使用深度學(xué)習(xí)技術(shù)進(jìn)行前處理(如成像質(zhì)量改善、成像速度提升、圖像重建)、流程優(yōu)化(如一鍵操作)、常規(guī)后處理(如圖像分割、數(shù)據(jù)測(cè)量)等非輔助決策的軟件可參考使用本審評(píng)要點(diǎn)。

這里以是否“輔助決策”對(duì)產(chǎn)品進(jìn)行了劃分,強(qiáng)調(diào)了產(chǎn)品的“輔助”功能;同時(shí),也明確表示非輔助決策軟件也將以類(lèi)似手段進(jìn)入審批流程。

關(guān)鍵詞二:審批重點(diǎn)

《要點(diǎn)》中提到,本審評(píng)要點(diǎn)重點(diǎn)關(guān)注軟件的數(shù)據(jù)質(zhì)量控制、算法泛化能力、臨床使用風(fēng)險(xiǎn),臨床使用風(fēng)險(xiǎn)應(yīng)當(dāng)考慮數(shù)據(jù)質(zhì)量控制、算法泛化能力的直接影響,以及算力所用計(jì)算資源(即運(yùn)行環(huán)境)失效的間接影響。

基于風(fēng)險(xiǎn)的全生命周期管理是此類(lèi)軟件監(jiān)管的基本方法,軟件風(fēng)險(xiǎn)管理活動(dòng)應(yīng)當(dāng)基于軟件的預(yù)期用途(目標(biāo)疾病、臨床用途、重要程度、緊迫程度)、使用場(chǎng)景(適用人群、目標(biāo)用戶(hù)、使用場(chǎng)所、臨床流程)、核心功能(處理對(duì)象、數(shù)據(jù)兼容性、功能類(lèi)型)予以實(shí)施,并貫穿于軟件全生命周期過(guò)程。

軟件臨床使用風(fēng)險(xiǎn)主要包括假陰性和假陽(yáng)性,其中假陰性即漏診,可能導(dǎo)致后續(xù)診療活動(dòng)延誤,特別是要考慮快速進(jìn)展疾病的診療活動(dòng)延誤風(fēng)險(xiǎn);假陽(yáng)性即誤診,可能導(dǎo)致后續(xù)不必要的診療活動(dòng)。

進(jìn)口軟件除考慮假陽(yáng)性和假陰性風(fēng)險(xiǎn)外,還應(yīng)當(dāng)考慮中外人種、流行病學(xué)特征、臨床診療規(guī)范等方面差異的影響及其風(fēng)險(xiǎn)。生產(chǎn)企業(yè)應(yīng)當(dāng)采取充分的、適宜的、有效的風(fēng)險(xiǎn)控制措施以保證軟件的安全性和有效性。

關(guān)鍵詞三:數(shù)據(jù)來(lái)源

《要點(diǎn)》中提到,數(shù)據(jù)收集應(yīng)當(dāng)考慮數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、數(shù)據(jù)集構(gòu)建等活動(dòng)的質(zhì)控要求,以保證數(shù)據(jù)質(zhì)量和算法設(shè)計(jì)質(zhì)量。此外,應(yīng)當(dāng)考慮采集設(shè)備、采集過(guò)程以及數(shù)據(jù)脫敏的質(zhì)控要求;脫敏數(shù)據(jù)由臨床機(jī)構(gòu)轉(zhuǎn)移至生產(chǎn)企業(yè)形成原始數(shù)據(jù)庫(kù),不同模態(tài)的數(shù)據(jù)在原始數(shù)據(jù)庫(kù)中應(yīng)當(dāng)加以區(qū)分;數(shù)據(jù)標(biāo)注應(yīng)當(dāng)考慮標(biāo)注資源管理、標(biāo)注過(guò)程質(zhì)控、標(biāo)注質(zhì)量評(píng)估等要求。

關(guān)鍵詞四:算法設(shè)計(jì)

《要點(diǎn)》中提到,應(yīng)當(dāng)考慮算法選擇、算法訓(xùn)練、網(wǎng)絡(luò)安全防護(hù)、算法性能評(píng)估等活動(dòng)的質(zhì)控要求。建議數(shù)據(jù)驅(qū)動(dòng)與知識(shí)驅(qū)動(dòng)相結(jié)合進(jìn)行算法設(shè)計(jì),以提升算法可解釋性。

在原文中,《要點(diǎn)》對(duì)具體算法的選擇、訓(xùn)練方式、網(wǎng)絡(luò)安全都進(jìn)行了明確的要求。

關(guān)鍵詞五:以臨床評(píng)價(jià)為主的軟件確認(rèn)方式

根據(jù)軟件指導(dǎo)原則要求,軟件應(yīng)當(dāng)提交基于臨床試驗(yàn)的臨床評(píng)價(jià)資料,即提交申報(bào)產(chǎn)品的臨床試驗(yàn)資料,或者與申報(bào)產(chǎn)品核心算法具有實(shí)質(zhì)等同性的同品種產(chǎn)品或同類(lèi)軟件功能的臨床試驗(yàn)資料。

進(jìn)口軟件應(yīng)當(dāng)提供中外人種、流行病學(xué)特征、臨床診療規(guī)范等方面差異影響的臨床評(píng)價(jià)資料,若不足以證實(shí)申報(bào)產(chǎn)品在中國(guó)使用的安全性和有效性,應(yīng)當(dāng)在中國(guó)開(kāi)展臨床試驗(yàn)。使用境外臨床試驗(yàn)數(shù)據(jù)應(yīng)當(dāng)滿(mǎn)足《接受醫(yī)療器械境外臨床試驗(yàn)數(shù)據(jù)技術(shù)指導(dǎo)原則》要求。

而臨床試驗(yàn)應(yīng)當(dāng)符合《醫(yī)療器械臨床試驗(yàn)質(zhì)量管理規(guī)范》要求。建議優(yōu)先選擇同品種產(chǎn)品或臨床參考標(biāo)準(zhǔn)(即臨床金標(biāo)準(zhǔn))進(jìn)行非劣效對(duì)照設(shè)計(jì);建議臨床試驗(yàn)結(jié)果由第三方獨(dú)立評(píng)價(jià);臨床評(píng)價(jià)可采用基于現(xiàn)有歷史數(shù)據(jù)的回顧性研究。

關(guān)鍵詞六:注冊(cè)申報(bào)資料說(shuō)明

《要點(diǎn)》中提到,申報(bào)的軟件名稱(chēng)需符合獨(dú)立軟件通用名稱(chēng)命名規(guī)范要求,體現(xiàn)處理對(duì)象(如CT圖像、眼底照片)、目標(biāo)疾。ê∽、疾病屬性)、臨床用途(如輔助篩查、輔助識(shí)別)等特征詞。

輔助決策獨(dú)立軟件適用范圍應(yīng)當(dāng)明確預(yù)期用途、使用場(chǎng)景和核心功能,包括但不限于處理對(duì)象、目標(biāo)疾病、臨床用途、適用人群、目標(biāo)用戶(hù)、使用場(chǎng)所、采集設(shè)備要求、臨床使用限制。

企業(yè)必須提供:一、軟件描述文檔核心算法部分應(yīng)當(dāng)結(jié)合本審評(píng)要點(diǎn)提供相應(yīng)算法研究資料;二、包括數(shù)據(jù)來(lái)源合規(guī)性聲明;三、算法性能影響因素分析資料以及各類(lèi)測(cè)試場(chǎng)景下算法性能評(píng)估結(jié)果比較分析資料。

說(shuō)明書(shū)應(yīng)當(dāng)符合《醫(yī)療器械說(shuō)明書(shū)和標(biāo)簽管理規(guī)定》要求。

除了上述六個(gè)關(guān)鍵點(diǎn)外,《要點(diǎn)》還明確了非輔助決策軟件、傳統(tǒng)人工智能軟件的要求以及第三方數(shù)據(jù)庫(kù)、移動(dòng)與云計(jì)算等考量。在此之中提出了“前處理軟件功能原則上應(yīng)當(dāng)開(kāi)展算法性能評(píng)估、臨床評(píng)價(jià);流程優(yōu)化軟件功能開(kāi)展算法性能評(píng)估即可,無(wú)需開(kāi)展臨床評(píng)價(jià);常規(guī)后處理軟件功能原則上開(kāi)展算法性能評(píng)估即可,全新功能應(yīng)當(dāng)開(kāi)展臨床評(píng)價(jià)”的評(píng)價(jià)要求。

以下為《深度學(xué)習(xí)輔助巨冊(cè)醫(yī)療器械軟件審批要點(diǎn)》全文。

一、適用范圍

本審評(píng)要點(diǎn)適用于深度學(xué)習(xí)輔助決策醫(yī)療器械軟件(含獨(dú)立軟件、軟件組件)的注冊(cè)申報(bào)。深度學(xué)習(xí)輔助決策醫(yī)療器械軟件(以下簡(jiǎn)稱(chēng)軟件)即基于醫(yī)療器械數(shù)據(jù)(醫(yī)療器械所生成的醫(yī)學(xué)圖像、醫(yī)學(xué)數(shù)據(jù),以下統(tǒng)稱(chēng)數(shù)據(jù)),使用深度學(xué)習(xí)技術(shù)進(jìn)行輔助決策的軟件。其中,“基于醫(yī)療器械數(shù)據(jù)”是指單獨(dú)使用醫(yī)療器械數(shù)據(jù),或者聯(lián)合使用醫(yī)療器械數(shù)據(jù)與非醫(yī)療器械數(shù)據(jù);“輔助決策”是指通過(guò)提供診療活動(dòng)建議輔助醫(yī)務(wù)人員進(jìn)行臨床決策。

使用深度學(xué)習(xí)技術(shù)進(jìn)行前處理(如成像質(zhì)量改善、成像速度提升、圖像重建)、流程優(yōu)化(如一鍵操作)、常規(guī)后處理(如圖像分割、數(shù)據(jù)測(cè)量)等非輔助決策的軟件可參考使用本審評(píng)要點(diǎn)。使用傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)的軟件亦可參考使用本審評(píng)要點(diǎn)。

本審評(píng)要點(diǎn)遵循《醫(yī)療器械軟件注冊(cè)技術(shù)審查指導(dǎo)原則》(以下簡(jiǎn)稱(chēng)軟件指導(dǎo)原則)、《醫(yī)療器械網(wǎng)絡(luò)安全注冊(cè)技術(shù)審查指導(dǎo)原則》(以下簡(jiǎn)稱(chēng)網(wǎng)絡(luò)安全指導(dǎo)原則)、《移動(dòng)醫(yī)療器械注冊(cè)技術(shù)審查指導(dǎo)原則》(以下簡(jiǎn)稱(chēng)移動(dòng)器械指導(dǎo)原則)等相關(guān)指導(dǎo)原則要求。

本審評(píng)要點(diǎn)不含人工智能倫理、數(shù)據(jù)產(chǎn)權(quán)等法律法規(guī)層面要求,但生產(chǎn)企業(yè)應(yīng)當(dāng)在軟件全生命周期過(guò)程中考慮相關(guān)規(guī)定。

二、審評(píng)關(guān)注重點(diǎn)

從發(fā)展驅(qū)動(dòng)要素角度講,深度學(xué)習(xí)實(shí)為基于海量數(shù)據(jù)和高算力的黑盒算法。本審評(píng)要點(diǎn)重點(diǎn)關(guān)注軟件的數(shù)據(jù)質(zhì)量控制、算法泛化能力、臨床使用風(fēng)險(xiǎn),臨床使用風(fēng)險(xiǎn)應(yīng)當(dāng)考慮數(shù)據(jù)質(zhì)量控制、算法泛化能力的直接影響,以及算力所用計(jì)算資源(即運(yùn)行環(huán)境)失效的間接影響。

基于風(fēng)險(xiǎn)的全生命周期管理是此類(lèi)軟件監(jiān)管的基本方法,相關(guān)考量詳見(jiàn)軟件指導(dǎo)原則、網(wǎng)絡(luò)安全指導(dǎo)原則、移動(dòng)器械指導(dǎo)原則以及醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范獨(dú)立軟件附錄。下面結(jié)合審評(píng)關(guān)注重點(diǎn)分別闡述軟件風(fēng)險(xiǎn)管理、軟件設(shè)計(jì)開(kāi)發(fā)、軟件更新等方面考量。

軟件風(fēng)險(xiǎn)管理活動(dòng)應(yīng)當(dāng)基于軟件的預(yù)期用途(目標(biāo)疾病、臨床用途、重要程度、緊迫程度)、使用場(chǎng)景(適用人群、目標(biāo)用戶(hù)、使用場(chǎng)所、臨床流程)、核心功能(處理對(duì)象、數(shù)據(jù)兼容性、功能類(lèi)型)予以實(shí)施,并貫穿于軟件全生命周期過(guò)程。軟件臨床使用風(fēng)險(xiǎn)主要包括假陰性和假陽(yáng)性,其中假陰性即漏診,可能導(dǎo)致后續(xù)診療活動(dòng)延誤,特別是要考慮快速進(jìn)展疾病的診療活動(dòng)延誤風(fēng)險(xiǎn);假陽(yáng)性即誤診,可能導(dǎo)致后續(xù)不必要的診療活動(dòng)。進(jìn)口軟件除考慮假陽(yáng)性和假陰性風(fēng)險(xiǎn)外,還應(yīng)當(dāng)考慮中外人種、流行病學(xué)特征、臨床診療規(guī)范等方面差異的影響及其風(fēng)險(xiǎn)。生產(chǎn)企業(yè)應(yīng)當(dāng)采取充分的、適宜的、有效的風(fēng)險(xiǎn)控制措施以保證軟件的安全性和有效性。

軟件典型設(shè)計(jì)開(kāi)發(fā)過(guò)程通?煞譃樾枨蠓治、數(shù)據(jù)收集、算法設(shè)計(jì)、驗(yàn)證與確認(rèn)等階段。

1

需求分析

需求分析應(yīng)當(dāng)以軟件的臨床需求與使用風(fēng)險(xiǎn)為導(dǎo)向,結(jié)合軟件的預(yù)期用途、使用場(chǎng)景和核心功能,綜合考慮法規(guī)、標(biāo)準(zhǔn)、用戶(hù)、產(chǎn)品、數(shù)據(jù)、功能、性能、接口、用戶(hù)界面、網(wǎng)絡(luò)安全、警示提示等方面需求,重點(diǎn)考慮數(shù)據(jù)收集、算法性能、臨床使用限制等方面要求。

數(shù)據(jù)收集應(yīng)當(dāng)考慮數(shù)據(jù)來(lái)源的合規(guī)性和多樣性、目標(biāo)疾病流行病學(xué)特征、數(shù)據(jù)質(zhì)量控制要求(詳見(jiàn)下節(jié))。數(shù)據(jù)來(lái)源應(yīng)當(dāng)在合規(guī)性基礎(chǔ)上保證數(shù)據(jù)多樣性,以提高算法泛化能力,如盡可能來(lái)自多家、不同地域、不同層級(jí)的代表性臨床機(jī)構(gòu),盡可能來(lái)自多種、不同采集參數(shù)的采集設(shè)備。目標(biāo)疾病流行病學(xué)特征包括但不限于疾病構(gòu)成(如分型、分級(jí)、分期)、人群分布(如健康、患者,性別、年齡、職業(yè)、地域、生活方式)、統(tǒng)計(jì)指標(biāo)(如發(fā)病率、患病率、治愈率、死亡率、生存率)等情況,以及目標(biāo)疾病并發(fā)癥與類(lèi)似疾病的影響情況。

算法性能應(yīng)當(dāng)考慮假陰性與假陽(yáng)性(指標(biāo)、關(guān)系)、重復(fù)性與再現(xiàn)性、魯棒性/健壯性等要求。

臨床使用限制應(yīng)當(dāng)考慮臨床禁用、慎用等場(chǎng)景。

2

數(shù)據(jù)收集

數(shù)據(jù)收集應(yīng)當(dāng)考慮數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、數(shù)據(jù)集構(gòu)建等活動(dòng)的質(zhì)控要求,以保證數(shù)據(jù)質(zhì)量和算法設(shè)計(jì)質(zhì)量。

1. 數(shù)據(jù)采集

數(shù)據(jù)采集主要由臨床機(jī)構(gòu)實(shí)施,應(yīng)當(dāng)考慮采集設(shè)備、采集過(guò)程以及數(shù)據(jù)脫敏的質(zhì)控要求。

采集設(shè)備質(zhì)控應(yīng)當(dāng)明確采集設(shè)備的兼容性要求和采集要求。兼容性要求應(yīng)當(dāng)基于數(shù)據(jù)生成方式(直接生成、間接生成)提供采集設(shè)備兼容性列表或技術(shù)要求,明確采集設(shè)備的制造商、型號(hào)規(guī)格、性能指標(biāo)等要求,若對(duì)采集設(shè)備無(wú)具體要求應(yīng)當(dāng)提供相應(yīng)支持資料。采集要求應(yīng)當(dāng)明確采集設(shè)備的采集方式(如常規(guī)成像、增強(qiáng)成像)、采集協(xié)議(如MRI成像序列)、采集參數(shù)(如CT加載電壓、加載電流、加載時(shí)間、層厚)、采集精度(如分辨率、采樣率)等要求。

采集過(guò)程質(zhì)控應(yīng)當(dāng)建立數(shù)據(jù)采集操作規(guī)范,明確采集人員要求和采集過(guò)程要求。采集人員要求包括人員的選拔、培訓(xùn)、考核。采集過(guò)程要求包括人員職責(zé)、采集流程(如采集步驟、操作要求)。

若使用現(xiàn)有歷史數(shù)據(jù),應(yīng)當(dāng)明確采集設(shè)備要求、數(shù)據(jù)采集質(zhì)量評(píng)估要求(如人員、方法、指標(biāo)、通過(guò)準(zhǔn)則)。

采集的數(shù)據(jù)應(yīng)當(dāng)進(jìn)行數(shù)據(jù)脫敏以保護(hù)患者隱私。數(shù)據(jù)脫敏應(yīng)當(dāng)明確脫敏的類(lèi)型(靜態(tài)、動(dòng)態(tài))、規(guī)則、程度、方法。

2. 數(shù)據(jù)預(yù)處理

脫敏數(shù)據(jù)由臨床機(jī)構(gòu)轉(zhuǎn)移至生產(chǎn)企業(yè)形成原始數(shù)據(jù)庫(kù),不同模態(tài)的數(shù)據(jù)在原始數(shù)據(jù)庫(kù)中應(yīng)當(dāng)加以區(qū)分(下同)。

數(shù)據(jù)預(yù)處理應(yīng)當(dāng)基于原始數(shù)據(jù)庫(kù)考慮數(shù)據(jù)處理、數(shù)據(jù)清洗的質(zhì)控要求。數(shù)據(jù)處理應(yīng)當(dāng)明確處理的方法,如濾波、增強(qiáng)、重采樣、尺寸裁剪、均一化等。數(shù)據(jù)清洗應(yīng)當(dāng)明確清洗的規(guī)則、方法。

數(shù)據(jù)處理和清洗應(yīng)當(dāng)明確選用軟件工具的名稱(chēng)、型號(hào)規(guī)格、完整版本、供應(yīng)商、運(yùn)行環(huán)境、確認(rèn)等要求,同時(shí)考慮數(shù)據(jù)處理選用方法對(duì)軟件的影響及其風(fēng)險(xiǎn)。

數(shù)據(jù)經(jīng)預(yù)處理后形成基礎(chǔ)數(shù)據(jù)庫(kù),應(yīng)當(dāng)明確樣本類(lèi)型、樣本量、樣本分布等信息。樣本類(lèi)型以適用人群為單位可分為數(shù)據(jù)序列(由多個(gè)單一數(shù)據(jù)組成,如結(jié)構(gòu)序列、功能序列、時(shí)間序列)、單一數(shù)據(jù)。樣本量應(yīng)當(dāng)明確樣本規(guī)模及確定依據(jù),需要考慮樣本量不足對(duì)軟件的影響及其風(fēng)險(xiǎn)。樣本分布應(yīng)當(dāng)依據(jù)疾病構(gòu)成、適用人群、數(shù)據(jù)來(lái)源機(jī)構(gòu)、采集設(shè)備、樣本類(lèi)型等因素明確數(shù)據(jù)分布情況,需要考慮數(shù)據(jù)偏性對(duì)軟件的影響及其風(fēng)險(xiǎn)。

3. 數(shù)據(jù)標(biāo)注

數(shù)據(jù)標(biāo)注應(yīng)當(dāng)考慮標(biāo)注資源管理、標(biāo)注過(guò)程質(zhì)控、標(biāo)注質(zhì)量評(píng)估等要求。

標(biāo)注資源管理包括人員管理和基礎(chǔ)設(shè)施管理。人員管理應(yīng)當(dāng)明確標(biāo)注人員和仲裁人員的選拔(如職稱(chēng)、工作年限、工作經(jīng)驗(yàn)、所在機(jī)構(gòu),若有國(guó)外人員應(yīng)當(dāng)明確其資質(zhì)要求)、培訓(xùn)、考核(如方法、頻次、指標(biāo)、通過(guò)準(zhǔn)則,其中指標(biāo)應(yīng)當(dāng)包括重復(fù)性、再現(xiàn)性)等要求。基礎(chǔ)設(shè)施管理應(yīng)當(dāng)明確標(biāo)注場(chǎng)所(真實(shí)或模擬,環(huán)境、照明條件)、標(biāo)注軟件(名稱(chēng)、型號(hào)規(guī)格、完整版本、供應(yīng)商、運(yùn)行環(huán)境、確認(rèn))等要求。

標(biāo)注過(guò)程質(zhì)控應(yīng)當(dāng)建立數(shù)據(jù)標(biāo)注操作規(guī)范,明確標(biāo)注人員(如資質(zhì)、數(shù)量、職責(zé))、標(biāo)注流程(如標(biāo)注對(duì)象、標(biāo)注形式、標(biāo)注輪次、標(biāo)注步驟、操作要求)、臨床診療規(guī)范(如臨床指南、專(zhuān)家共識(shí))、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數(shù)據(jù)、操作)等要求。

標(biāo)注質(zhì)量評(píng)估應(yīng)當(dāng)明確人員、方法、指標(biāo)、通過(guò)準(zhǔn)則等要求。

數(shù)據(jù)經(jīng)標(biāo)注后形成標(biāo)注數(shù)據(jù)庫(kù),其樣本類(lèi)型可分為數(shù)據(jù)序列、單一數(shù)據(jù)(由多個(gè)數(shù)據(jù)塊組成)、數(shù)據(jù)塊(圖像區(qū)域、數(shù)據(jù)片段)。樣本量、樣本分布等要求及風(fēng)險(xiǎn)考量與基礎(chǔ)數(shù)據(jù)庫(kù)相同。

4.?dāng)?shù)據(jù)集構(gòu)建

基于標(biāo)注數(shù)據(jù)庫(kù)構(gòu)建訓(xùn)練集(用于算法訓(xùn)練)、調(diào)優(yōu)集(若有,用于算法超參數(shù)調(diào)優(yōu))、測(cè)試集(用于算法性能評(píng)估),明確訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的劃分方法、劃分依據(jù)、數(shù)據(jù)分配比例。訓(xùn)練集應(yīng)當(dāng)保證樣本分布具有均衡性,測(cè)試集、調(diào)優(yōu)集應(yīng)當(dāng)保證樣本分布符合臨床實(shí)際情況,訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的樣本應(yīng)當(dāng)兩兩無(wú)交集。

為解決數(shù)據(jù)樣本分布不滿(mǎn)足預(yù)期目標(biāo)的問(wèn)題,可對(duì)訓(xùn)練集、調(diào)優(yōu)集小樣本量數(shù)據(jù)進(jìn)行擴(kuò)增;測(cè)試集不宜進(jìn)行數(shù)據(jù)擴(kuò)增,若擴(kuò)增應(yīng)當(dāng)分析對(duì)軟件的影響及其風(fēng)險(xiǎn)。數(shù)據(jù)擴(kuò)增應(yīng)當(dāng)明確擴(kuò)增的方式(離線、在線)、方法(如翻轉(zhuǎn)、旋轉(zhuǎn)、鏡像、平移、縮放、濾波等)、倍數(shù),并考慮擴(kuò)增方法選用以及擴(kuò)增倍數(shù)過(guò)大對(duì)軟件的影響及其風(fēng)險(xiǎn)。

數(shù)據(jù)經(jīng)擴(kuò)增后形成擴(kuò)增數(shù)據(jù)庫(kù),應(yīng)當(dāng)列表對(duì)比擴(kuò)增數(shù)據(jù)庫(kù)與標(biāo)注數(shù)據(jù)庫(kù)在樣本量、樣本分布(注明擴(kuò)增倍數(shù))等方面的差異,以證實(shí)擴(kuò)增數(shù)據(jù)庫(kù)樣本量的充分性以及樣本分布的合理性。

1  2  3  下一頁(yè)>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)