“計(jì)算醫(yī)學(xué)”發(fā)現(xiàn)藥物標(biāo)志物,交叉團(tuán)隊(duì)組網(wǎng)藥物 “北斗系統(tǒng)”
藥物研發(fā)正面臨巨大挑戰(zhàn),新藥研發(fā)周期長(約14年)、新藥研發(fā)成本居高不下(超10億美元),上市藥物九死一生(成功率不足10%)…...為了扭轉(zhuǎn)頹勢,預(yù)期能夠降低研發(fā)成本的AI技術(shù)受到了制藥行業(yè)的關(guān)注。
AI+藥物研發(fā)賽道全球已有超100家企業(yè),大多數(shù)集中在優(yōu)化候選藥物這一環(huán)節(jié)。不幸的是,進(jìn)入臨床一期候選藥物數(shù)量的增加并不能直接帶來上市成功率的顯著提升。藥企如果借力大數(shù)據(jù)和AI技術(shù)在以下幾個問題上找到突破性的解決方案,將帶來巨大的回報(bào):如何提高臨床試驗(yàn)成功率?如何提高藥物的有效率?如何不斷拓展適應(yīng)癥?能否喚回失敗的藥物?
這幾個問題都可歸結(jié)于如何找到能讓人藥更匹配的標(biāo)志物。生物標(biāo)志物用于疾病診斷、分型、分期,判斷藥物在目標(biāo)人群的有效性和安全性,在藥物開發(fā)與臨床應(yīng)用中的作用日益提升,被喻為藥物研發(fā)漫漫征途中的“指南針”。
那么,標(biāo)志物開發(fā)的現(xiàn)狀如何?AI+大數(shù)據(jù)如何助力標(biāo)志物開發(fā)?除了單分子,標(biāo)志物還能以什么形式產(chǎn)生?
在本文中,有以下六個要點(diǎn)值得關(guān)注
1.單一分子生物標(biāo)志物紅利逐漸枯竭,基于大數(shù)據(jù)的新標(biāo)志物將帶來新紅利;
2.從數(shù)據(jù)到標(biāo)志物,存在維度詛咒、變異洪流、算力泥沼三大挑戰(zhàn);
3.來自中國頂尖機(jī)構(gòu)的生命與計(jì)算交叉團(tuán)隊(duì),潛心二十年,研發(fā)出基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎;
4.渡過技術(shù)和數(shù)據(jù)積累期,藥物Pattern發(fā)現(xiàn)引擎TD-P平臺進(jìn)入商業(yè)化階段;
5.平臺的最新成果,CDK4/6抑制劑在乳腺癌以外癌種中的新應(yīng)用場景已經(jīng)被發(fā)現(xiàn);
6.實(shí)現(xiàn)藥物研發(fā)從”三個10”到“三個5”的全面升級。
簡單標(biāo)志物紅利枯竭,大數(shù)據(jù)中蘊(yùn)藏新紅利
單一分子生物標(biāo)志物曾經(jīng)成就過諸多的明星靶向藥物。但是簡單標(biāo)志物紅利正在逐漸枯竭。如果將藥物伴隨診斷的基因組學(xué)標(biāo)志物的發(fā)現(xiàn)比喻為從樹上摘桃子的話,這種通過“篩選”單個位點(diǎn)突變就能獲得明確標(biāo)志物的方式就好比摘低處的桃子,易得且成本優(yōu)勢明顯,但畢竟這樣的桃子數(shù)量有限,目前基本被摘完。
全球每年產(chǎn)生的生物數(shù)據(jù)總量已達(dá)EB(109G)級。隨著不斷下降的測序成本,多種組學(xué)數(shù)據(jù)、醫(yī)學(xué)影像和臨床資料在內(nèi)統(tǒng)計(jì)的數(shù)據(jù)產(chǎn)出達(dá)到了10TB/人的水平。生物醫(yī)學(xué)大數(shù)據(jù)已經(jīng)可以完整刻畫生命系統(tǒng)。 PubMed 數(shù)據(jù)庫收錄生物醫(yī)學(xué)3000萬篇文獻(xiàn),每天還有超1萬篇的新提交。 利用知識、解讀數(shù)據(jù)來尋找新標(biāo)志物的新紅利,無疑為業(yè)內(nèi)帶來了新期望。美國FDA腫瘤學(xué)卓越研究中心前主任曾表示,人工智能最有希望的應(yīng)用之一是生物標(biāo)志物的發(fā)現(xiàn)與開發(fā)。
從全球?qū)嵺`來看,國際上已經(jīng)出現(xiàn)了幾家能利用知識圖譜、機(jī)器學(xué)習(xí)掌控生物醫(yī)學(xué)大數(shù)據(jù)的AI公司。英國獨(dú)角獸公司Benevolent AI和諾華制藥公司在2019年簽訂了一項(xiàng)合作,旨在利用AI技術(shù)探索臨床階段腫瘤藥物適應(yīng)癥和響應(yīng)人群。Insilico Medicine公司通過收集大量不同年齡的健康和患病人群的多類組學(xué)數(shù)據(jù),尋找與衰老和疾病有關(guān)的生物標(biāo)記物。
從數(shù)據(jù)到標(biāo)志物,逃避不開的三個門檻
有了數(shù)據(jù)就一定能發(fā)現(xiàn)標(biāo)志物嗎?
數(shù)據(jù)具有高維性和復(fù)雜性特點(diǎn),要利用AI技術(shù)挖掘出新標(biāo)志物仍然挑戰(zhàn)重重:
第一,維度詛咒。數(shù)據(jù)爆炸帶來了數(shù)千或數(shù)萬個可檢測的潛在生物標(biāo)志物。傳統(tǒng)的生物信息學(xué)工具、分析方法無法將日益增長、多樣性的數(shù)據(jù)用以發(fā)現(xiàn)生物標(biāo)志物。用上述方法篩選出的生物標(biāo)志物只能代表小范圍內(nèi)的患者特征,在前瞻性臨床試驗(yàn)中無法得到驗(yàn)證。在這種情況下,AI算法如何將生物標(biāo)記信號從噪聲中分離出來變得非常重要。
第二,變異洪流。通過測序技術(shù),我們現(xiàn)在已經(jīng)能較為清晰的看到腫瘤基因組的全貌,但是“畫面”卻極度混亂。每個腫瘤都包含50~100種變異,不同腫瘤又都各不相同,多數(shù)基因變異人類還不認(rèn)識。但基因不是孤立作戰(zhàn),而是作為群體通過各種通路所形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng)來傳遞各種增殖和凋亡信號。不僅要發(fā)現(xiàn)單個變異,AI算法更需要從復(fù)雜的基因網(wǎng)絡(luò)中識別標(biāo)志物。
第三,算力泥沼。能否掌控算力又是下一個深具挑戰(zhàn)的關(guān)卡。理解生物醫(yī)學(xué)大數(shù)據(jù)必須利用超算。擁有算力已相對容易,社會上的超算中心、云計(jì)算中心可付費(fèi)獲得。但是現(xiàn)成的算力并不是為生物醫(yī)學(xué)大數(shù)據(jù)而設(shè)計(jì),如果處理計(jì)算密集型的算法能打100分,處理基因組數(shù)據(jù)只能打1分。如果將算力比喻為飛機(jī),開動裝載生物醫(yī)學(xué)數(shù)據(jù)的飛機(jī)還得有并行優(yōu)化技術(shù)來當(dāng)駕駛員。具備生物醫(yī)學(xué)領(lǐng)域知識專用并行優(yōu)化技術(shù)的團(tuán)隊(duì),在全球來說都是稀缺資源。
基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎
在過去的二十年中,中國科學(xué)院計(jì)算技術(shù)研究所高性能計(jì)算機(jī)研究中心一直在從事“生物醫(yī)學(xué)信息處理系統(tǒng)”的研究,在國家項(xiàng)目的支持下,已經(jīng)在面向生物醫(yī)學(xué)大數(shù)據(jù)的高性能計(jì)算處理技術(shù)、生命融合大數(shù)據(jù)分析技術(shù)方面取得了多項(xiàng)重大技術(shù)突破。
該中心的生命與計(jì)算交叉團(tuán)隊(duì)首倡“計(jì)算醫(yī)學(xué)”,利用人工智能、高性能計(jì)算技術(shù)從單個基因或蛋白功能的解釋轉(zhuǎn)向從系統(tǒng)生物學(xué),尤其是細(xì)胞信號通路的解釋中挖掘Pattern級(實(shí)現(xiàn)某一生物性能的一組基因組成的功能模塊)的新型標(biāo)志物。
計(jì)算醫(yī)學(xué)從全局變異角度解讀數(shù)據(jù)。雖然腫瘤有很多罕見變異,但是它們驅(qū)動的下游事件并不罕見。因此,如果能構(gòu)建一種新的模型,建立罕見變異與下游事件的關(guān)系,就能夠破解腫瘤異質(zhì)性難題,找出未被發(fā)現(xiàn)的腫瘤進(jìn)化生物學(xué)機(jī)制,挖掘Pattern級標(biāo)志物。
就像是AlphaGo,它比人類厲害的地方在于,它的算法更關(guān)注大局觀,而不是局部計(jì)算。在每個局部計(jì)算中找到最優(yōu)的下法并不一定能獲得最終勝利,只有清晰理解全局戰(zhàn)況,才能做出必勝策略。
這也就是團(tuán)隊(duì)這些年來的主要發(fā)力方向。
破解維度詛咒,將變異洪流降維到細(xì)胞功能事件模型。團(tuán)隊(duì)大數(shù)據(jù)建模過程與AlphaGo的算法策略異曲同工。團(tuán)隊(duì)根據(jù)曾發(fā)生變異的18000基因,1000種不同來源細(xì)胞系基因組內(nèi)罕見變異的基因集合特征,對200+種表型特征(細(xì)胞內(nèi)確定性事件集)進(jìn)行關(guān)聯(lián)訓(xùn)練,獲得基于神經(jīng)網(wǎng)絡(luò)的細(xì)胞行為、功能、信號通路之間的關(guān)系模型,將零散、孤立的變異轉(zhuǎn)化成有功能、有解釋意義的事件。團(tuán)隊(duì)沒有直接將基因變異與疾病建模關(guān)聯(lián),而是先降維到細(xì)胞功能事件模型,再去與疾病、藥物關(guān)聯(lián),這極大提高了從數(shù)據(jù)中發(fā)現(xiàn)新洞見的效能。
經(jīng)過數(shù)年的基礎(chǔ)工作,團(tuán)隊(duì)已經(jīng)產(chǎn)出了400+細(xì)胞內(nèi)確定性事件基礎(chǔ)模型。擊敗人類的圍棋機(jī)器人AlphaGo面對的是19路圍棋棋盤的361個落點(diǎn),可以變幻出無數(shù)的棋路。同樣,這400種基礎(chǔ)模型可以組合無數(shù)種不同的腫瘤進(jìn)化情況,足以為每個患者構(gòu)造一個數(shù)字生命方程式。現(xiàn)已驗(yàn)證的肺癌病例中無陰性報(bào)告,整體有效率為70.6%,抗血管生成通路有效率更高達(dá)91%。
將變異數(shù)據(jù)編碼為細(xì)胞功能事件
從知識中推理生物醫(yī)學(xué)機(jī)制新洞見。團(tuán)隊(duì)根據(jù)海量的生物醫(yī)學(xué)文獻(xiàn)構(gòu)建了自己的生命科學(xué)專用知識圖譜TWIRLS,去發(fā)現(xiàn)疾。硇停颍鞍祝幬镏g的關(guān)聯(lián)。應(yīng)用這一知識圖譜,不僅能夠最大化地挖掘已有的知識,還可以根據(jù)已有的知識做出推斷,產(chǎn)生新知識。
在新冠疫情期間,團(tuán)隊(duì)在4小時內(nèi)通過對1.4萬多篇有關(guān)冠狀病毒文獻(xiàn)智能推理分析,最終得出病毒與ACE2之間的結(jié)合可能引發(fā)ACE2/AT2R的功能變化,使腎素——血管緊張素系統(tǒng)(RAS)參與的細(xì)胞因子調(diào)控軸發(fā)生穩(wěn)態(tài)失衡,并最終導(dǎo)致“細(xì)胞因子風(fēng)暴”的結(jié)論。團(tuán)隊(duì)認(rèn)為這可能是參與冠狀病毒感染后導(dǎo)致宿主病理性變化的重要調(diào)控因素,也得到了國內(nèi)三家權(quán)威機(jī)構(gòu)回顧性研究的確認(rèn)。該研究最近發(fā)表于《DRUG DEVELOPMENT RESEARCH》期刊。
大幅提速數(shù)據(jù)處理效能的高性能計(jì)算。團(tuán)隊(duì)擁有世界領(lǐng)先的并行優(yōu)化算法,在訓(xùn)練模型階段,團(tuán)隊(duì)用到了106G的數(shù)據(jù),調(diào)動 2000個CPU運(yùn)行半年。如果沒有并行優(yōu)化技術(shù),即使歷時數(shù)年也可能跑不出結(jié)果。對同一模型、同一數(shù)據(jù)量處理,如果直接在小型機(jī)上計(jì)算需要1萬小時,加載并行優(yōu)化技術(shù)后,計(jì)算時間可壓縮到100小時。高水平的并行優(yōu)化團(tuán)隊(duì)還能再獲得更大的效率收益。
渡過技術(shù)和數(shù)據(jù)積累期,TD-P平臺開放商業(yè)化服務(wù)
基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎是否還是一個科研階段,能提供商業(yè)化解決方案嗎?
為了將“生物醫(yī)學(xué)信息處理系統(tǒng)”賦能產(chǎn)業(yè),中科院計(jì)算所孵化了哲源科技,對其研究成果進(jìn)行轉(zhuǎn)化,并聯(lián)合成立了“中國科學(xué)院計(jì)算技術(shù)研究所·哲源-圖靈-達(dá)爾文實(shí)驗(yàn)室”,致力于計(jì)算醫(yī)學(xué)的發(fā)展,通過藥物Pattern發(fā)現(xiàn)引擎TD-P平臺(Turing-Darwin Pattern Discovery Platform)賦能藥物研發(fā)、精準(zhǔn)醫(yī)學(xué)。該平臺已經(jīng)渡過了技術(shù)積累和數(shù)據(jù)積累期,具備了工業(yè)化服務(wù)能力。
第一,標(biāo)志物兼容性好;赥D-P平臺不僅可以發(fā)現(xiàn)定量性質(zhì)的,具有生物學(xué)意義的新型標(biāo)志物,同時也能向下兼容單分子生物標(biāo)志物。例如,該平臺與國內(nèi)著名PI在某一實(shí)體腫瘤化療藥物適應(yīng)人群判斷的合作中,最終收斂出能夠被PCR技術(shù)檢測的變異位點(diǎn),質(zhì)優(yōu)價廉,為IVD行業(yè)帶來全新解決方案。
第二,迅捷解決臨床問題。針對某一特定藥物研發(fā)與臨床應(yīng)用場景需求,只需要投入較少量的指定樣本數(shù)據(jù)在該技術(shù)平臺適配,即可以周為單位交付初步發(fā)現(xiàn)的標(biāo)志物。然后利用后續(xù)患者數(shù)據(jù)在該模型中做進(jìn)一步前瞻性預(yù)測,優(yōu)化模型精準(zhǔn)度。同樣在上述案例中,20個樣本規(guī)模即有初步發(fā)現(xiàn),用預(yù)測模型對上百個前瞻性樣本預(yù)測的陽性檢出率達(dá)70%。
場景專屬模型適配
第三,適用場景廣泛。平臺一體兩面,為藥找人,為人找藥。在藥物研發(fā)階段,可以協(xié)助新藥臨床場景的選擇、臨床試驗(yàn)入組優(yōu)化、適應(yīng)癥擴(kuò)展、跨線晉級。在臨床應(yīng)用階段,為患者匹配響應(yīng)度最佳、副作用最小的用藥方案,將醫(yī)生臨床實(shí)踐中已經(jīng)積累的寶貴的臨床治療方案和經(jīng)驗(yàn)發(fā)揮到極致,實(shí)施更加精準(zhǔn)的個體化治療。
廣泛的服務(wù)場景
發(fā)現(xiàn)CDK4/6抑制劑新場景
TD-P平臺是否能為業(yè)界帶來重磅驚喜?
CDK4/6抑制劑是針對CDK4和CDK6兩個蛋白的靶向藥物,主要應(yīng)用于激素受體陽性Her2陰性的乳腺癌患者群體。首款CDK4/6抑制劑“愛博新”2019年銷售額近50億美元。多家知名企業(yè)都在布局CDK4/6抑制劑,預(yù)計(jì)國內(nèi)競爭將很快達(dá)到白熱化。
不過即便使用了雌激素受體作為生物標(biāo)志物,仍有大約20%的患者最初不會對CDK4 / 6抑制劑產(chǎn)生反應(yīng),并且所有患者最終都有產(chǎn)生耐藥性的可能。其他一些相關(guān)臨床試驗(yàn)也曾嘗試過多種不同分子標(biāo)志物,都不盡人意?梢哉f,采用單分子作為標(biāo)志物的努力基本宣告失敗。誰能回答以下問題,誰就更有機(jī)會在白熱化競爭的市場中勝出。
1. 是否存在標(biāo)志物預(yù)測患者的藥物反應(yīng)?
2. 是否可與內(nèi)分泌療法以外的其他療法結(jié)合使用?
3. 是否可將適應(yīng)癥擴(kuò)大到其他癌種?
TD-P平臺在對CDK4/6抑制劑以往的研究數(shù)據(jù)和臨床情況分析后,已經(jīng)發(fā)現(xiàn)幾個其他癌種的患者同樣能從CDK4/6抑制劑中獲益,療效甚至可能優(yōu)于乳腺癌患者。哲源科技也希望能與CDK4/6抑制劑研發(fā)企業(yè)合作這一自有成果。TD-P平臺還在抗血管藥物、PD-1/PD-L1單抗等抗腫瘤藥物的伴隨診斷開發(fā)、全新臨床場景挖掘、臨床試驗(yàn)入組優(yōu)化方面有突破性發(fā)現(xiàn)。
從”三個10”到“三個5”
中國科學(xué)院計(jì)算技術(shù)研究所西部高等技術(shù)研究院常務(wù)副院長張春明向動脈網(wǎng)表示:“我們希望利用緊貼臨床的人工智能加速藥物研發(fā),大幅降低研發(fā)費(fèi)用。將十年研發(fā)周期、十億美金投入、10%臨床試驗(yàn)成功率的‘三個10’研發(fā)挑戰(zhàn),提高到‘三個5’,即5年研發(fā)、5億美金、50%的臨床試驗(yàn)成功率。”
利用大數(shù)據(jù)、人工智能、高性能計(jì)算組網(wǎng)的藥物研發(fā)與應(yīng)用的“北斗系統(tǒng)”為面臨困局的醫(yī)藥行業(yè)開啟了藥物精準(zhǔn)定位的新時代。制造出藥物已經(jīng)不是競爭的終點(diǎn),提速臨床試驗(yàn)、不斷拓展新適應(yīng)癥、為患者提供更精準(zhǔn)響應(yīng)的藥物、更好地利用真實(shí)世界數(shù)據(jù)才是未來的競爭制勝之道。“計(jì)算醫(yī)學(xué)”從數(shù)字生命的視角認(rèn)識疾病與藥物,協(xié)助開發(fā)特異性、有效性、安全性更好的藥物,帶來更精準(zhǔn)的“人藥匹配”,將會帶動醫(yī)藥行業(yè)新一輪的智能化升級。
作者:郝翰
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
11月19日立即報(bào)名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月29日立即預(yù)約>> 【上海線下】設(shè)計(jì),易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會暨展覽會
-
精彩回顧立即查看>> 全數(shù)會2024中國人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
-
8 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市