侵權(quán)投訴
訂閱
糾錯
加入自媒體

“計(jì)算醫(yī)學(xué)”發(fā)現(xiàn)藥物標(biāo)志物,交叉團(tuán)隊(duì)組網(wǎng)藥物 “北斗系統(tǒng)”

藥物研發(fā)正面臨巨大挑戰(zhàn),新藥研發(fā)周期長(約14年)、新藥研發(fā)成本居高不下(超10億美元),上市藥物九死一生(成功率不足10%)…...為了扭轉(zhuǎn)頹勢,預(yù)期能夠降低研發(fā)成本的AI技術(shù)受到了制藥行業(yè)的關(guān)注。

AI+藥物研發(fā)賽道全球已有超100家企業(yè),大多數(shù)集中在優(yōu)化候選藥物這一環(huán)節(jié)。不幸的是,進(jìn)入臨床一期候選藥物數(shù)量的增加并不能直接帶來上市成功率的顯著提升。藥企如果借力大數(shù)據(jù)和AI技術(shù)在以下幾個問題上找到突破性的解決方案,將帶來巨大的回報(bào):如何提高臨床試驗(yàn)成功率?如何提高藥物的有效率?如何不斷拓展適應(yīng)癥?能否喚回失敗的藥物?

這幾個問題都可歸結(jié)于如何找到能讓人藥更匹配的標(biāo)志物。生物標(biāo)志物用于疾病診斷、分型、分期,判斷藥物在目標(biāo)人群的有效性和安全性,在藥物開發(fā)與臨床應(yīng)用中的作用日益提升,被喻為藥物研發(fā)漫漫征途中的“指南針”。

那么,標(biāo)志物開發(fā)的現(xiàn)狀如何?AI+大數(shù)據(jù)如何助力標(biāo)志物開發(fā)?除了單分子,標(biāo)志物還能以什么形式產(chǎn)生?

在本文中,有以下六個要點(diǎn)值得關(guān)注

1.單一分子生物標(biāo)志物紅利逐漸枯竭,基于大數(shù)據(jù)的新標(biāo)志物將帶來新紅利;

2.從數(shù)據(jù)到標(biāo)志物,存在維度詛咒、變異洪流、算力泥沼三大挑戰(zhàn);

3.來自中國頂尖機(jī)構(gòu)的生命與計(jì)算交叉團(tuán)隊(duì),潛心二十年,研發(fā)出基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎;

4.渡過技術(shù)和數(shù)據(jù)積累期,藥物Pattern發(fā)現(xiàn)引擎TD-P平臺進(jìn)入商業(yè)化階段;

5.平臺的最新成果,CDK4/6抑制劑在乳腺癌以外癌種中的新應(yīng)用場景已經(jīng)被發(fā)現(xiàn);

6.實(shí)現(xiàn)藥物研發(fā)從”三個10”到“三個5”的全面升級。

簡單標(biāo)志物紅利枯竭,大數(shù)據(jù)中蘊(yùn)藏新紅利

單一分子生物標(biāo)志物曾經(jīng)成就過諸多的明星靶向藥物。但是簡單標(biāo)志物紅利正在逐漸枯竭。如果將藥物伴隨診斷的基因組學(xué)標(biāo)志物的發(fā)現(xiàn)比喻為從樹上摘桃子的話,這種通過“篩選”單個位點(diǎn)突變就能獲得明確標(biāo)志物的方式就好比摘低處的桃子,易得且成本優(yōu)勢明顯,但畢竟這樣的桃子數(shù)量有限,目前基本被摘完。

全球每年產(chǎn)生的生物數(shù)據(jù)總量已達(dá)EB(109G)級。隨著不斷下降的測序成本,多種組學(xué)數(shù)據(jù)、醫(yī)學(xué)影像和臨床資料在內(nèi)統(tǒng)計(jì)的數(shù)據(jù)產(chǎn)出達(dá)到了10TB/人的水平。生物醫(yī)學(xué)大數(shù)據(jù)已經(jīng)可以完整刻畫生命系統(tǒng)。 PubMed 數(shù)據(jù)庫收錄生物醫(yī)學(xué)3000萬篇文獻(xiàn),每天還有超1萬篇的新提交。 利用知識、解讀數(shù)據(jù)來尋找新標(biāo)志物的新紅利,無疑為業(yè)內(nèi)帶來了新期望。美國FDA腫瘤學(xué)卓越研究中心前主任曾表示,人工智能最有希望的應(yīng)用之一是生物標(biāo)志物的發(fā)現(xiàn)與開發(fā)。

從全球?qū)嵺`來看,國際上已經(jīng)出現(xiàn)了幾家能利用知識圖譜、機(jī)器學(xué)習(xí)掌控生物醫(yī)學(xué)大數(shù)據(jù)的AI公司。英國獨(dú)角獸公司Benevolent AI和諾華制藥公司在2019年簽訂了一項(xiàng)合作,旨在利用AI技術(shù)探索臨床階段腫瘤藥物適應(yīng)癥和響應(yīng)人群。Insilico Medicine公司通過收集大量不同年齡的健康和患病人群的多類組學(xué)數(shù)據(jù),尋找與衰老和疾病有關(guān)的生物標(biāo)記物。

從數(shù)據(jù)到標(biāo)志物,逃避不開的三個門檻

有了數(shù)據(jù)就一定能發(fā)現(xiàn)標(biāo)志物嗎?

數(shù)據(jù)具有高維性和復(fù)雜性特點(diǎn),要利用AI技術(shù)挖掘出新標(biāo)志物仍然挑戰(zhàn)重重:

第一,維度詛咒。數(shù)據(jù)爆炸帶來了數(shù)千或數(shù)萬個可檢測的潛在生物標(biāo)志物。傳統(tǒng)的生物信息學(xué)工具、分析方法無法將日益增長、多樣性的數(shù)據(jù)用以發(fā)現(xiàn)生物標(biāo)志物。用上述方法篩選出的生物標(biāo)志物只能代表小范圍內(nèi)的患者特征,在前瞻性臨床試驗(yàn)中無法得到驗(yàn)證。在這種情況下,AI算法如何將生物標(biāo)記信號從噪聲中分離出來變得非常重要。

第二,變異洪流。通過測序技術(shù),我們現(xiàn)在已經(jīng)能較為清晰的看到腫瘤基因組的全貌,但是“畫面”卻極度混亂。每個腫瘤都包含50~100種變異,不同腫瘤又都各不相同,多數(shù)基因變異人類還不認(rèn)識。但基因不是孤立作戰(zhàn),而是作為群體通過各種通路所形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng)來傳遞各種增殖和凋亡信號。不僅要發(fā)現(xiàn)單個變異,AI算法更需要從復(fù)雜的基因網(wǎng)絡(luò)中識別標(biāo)志物。

第三,算力泥沼。能否掌控算力又是下一個深具挑戰(zhàn)的關(guān)卡。理解生物醫(yī)學(xué)大數(shù)據(jù)必須利用超算。擁有算力已相對容易,社會上的超算中心、云計(jì)算中心可付費(fèi)獲得。但是現(xiàn)成的算力并不是為生物醫(yī)學(xué)大數(shù)據(jù)而設(shè)計(jì),如果處理計(jì)算密集型的算法能打100分,處理基因組數(shù)據(jù)只能打1分。如果將算力比喻為飛機(jī),開動裝載生物醫(yī)學(xué)數(shù)據(jù)的飛機(jī)還得有并行優(yōu)化技術(shù)來當(dāng)駕駛員。具備生物醫(yī)學(xué)領(lǐng)域知識專用并行優(yōu)化技術(shù)的團(tuán)隊(duì),在全球來說都是稀缺資源。

基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎

在過去的二十年中,中國科學(xué)院計(jì)算技術(shù)研究所高性能計(jì)算機(jī)研究中心一直在從事“生物醫(yī)學(xué)信息處理系統(tǒng)”的研究,在國家項(xiàng)目的支持下,已經(jīng)在面向生物醫(yī)學(xué)大數(shù)據(jù)的高性能計(jì)算處理技術(shù)、生命融合大數(shù)據(jù)分析技術(shù)方面取得了多項(xiàng)重大技術(shù)突破。

該中心的生命與計(jì)算交叉團(tuán)隊(duì)首倡“計(jì)算醫(yī)學(xué)”,利用人工智能、高性能計(jì)算技術(shù)從單個基因或蛋白功能的解釋轉(zhuǎn)向從系統(tǒng)生物學(xué),尤其是細(xì)胞信號通路的解釋中挖掘Pattern級(實(shí)現(xiàn)某一生物性能的一組基因組成的功能模塊)的新型標(biāo)志物。

計(jì)算醫(yī)學(xué)從全局變異角度解讀數(shù)據(jù)。雖然腫瘤有很多罕見變異,但是它們驅(qū)動的下游事件并不罕見。因此,如果能構(gòu)建一種新的模型,建立罕見變異與下游事件的關(guān)系,就能夠破解腫瘤異質(zhì)性難題,找出未被發(fā)現(xiàn)的腫瘤進(jìn)化生物學(xué)機(jī)制,挖掘Pattern級標(biāo)志物。

就像是AlphaGo,它比人類厲害的地方在于,它的算法更關(guān)注大局觀,而不是局部計(jì)算。在每個局部計(jì)算中找到最優(yōu)的下法并不一定能獲得最終勝利,只有清晰理解全局戰(zhàn)況,才能做出必勝策略。

這也就是團(tuán)隊(duì)這些年來的主要發(fā)力方向。

破解維度詛咒,將變異洪流降維到細(xì)胞功能事件模型。團(tuán)隊(duì)大數(shù)據(jù)建模過程與AlphaGo的算法策略異曲同工。團(tuán)隊(duì)根據(jù)曾發(fā)生變異的18000基因,1000種不同來源細(xì)胞系基因組內(nèi)罕見變異的基因集合特征,對200+種表型特征(細(xì)胞內(nèi)確定性事件集)進(jìn)行關(guān)聯(lián)訓(xùn)練,獲得基于神經(jīng)網(wǎng)絡(luò)的細(xì)胞行為、功能、信號通路之間的關(guān)系模型,將零散、孤立的變異轉(zhuǎn)化成有功能、有解釋意義的事件。團(tuán)隊(duì)沒有直接將基因變異與疾病建模關(guān)聯(lián),而是先降維到細(xì)胞功能事件模型,再去與疾病、藥物關(guān)聯(lián),這極大提高了從數(shù)據(jù)中發(fā)現(xiàn)新洞見的效能。

經(jīng)過數(shù)年的基礎(chǔ)工作,團(tuán)隊(duì)已經(jīng)產(chǎn)出了400+細(xì)胞內(nèi)確定性事件基礎(chǔ)模型。擊敗人類的圍棋機(jī)器人AlphaGo面對的是19路圍棋棋盤的361個落點(diǎn),可以變幻出無數(shù)的棋路。同樣,這400種基礎(chǔ)模型可以組合無數(shù)種不同的腫瘤進(jìn)化情況,足以為每個患者構(gòu)造一個數(shù)字生命方程式。現(xiàn)已驗(yàn)證的肺癌病例中無陰性報(bào)告,整體有效率為70.6%,抗血管生成通路有效率更高達(dá)91%。

image.png

將變異數(shù)據(jù)編碼為細(xì)胞功能事件

從知識中推理生物醫(yī)學(xué)機(jī)制新洞見。團(tuán)隊(duì)根據(jù)海量的生物醫(yī)學(xué)文獻(xiàn)構(gòu)建了自己的生命科學(xué)專用知識圖譜TWIRLS,去發(fā)現(xiàn)疾。硇停颍鞍祝幬镏g的關(guān)聯(lián)。應(yīng)用這一知識圖譜,不僅能夠最大化地挖掘已有的知識,還可以根據(jù)已有的知識做出推斷,產(chǎn)生新知識。

在新冠疫情期間,團(tuán)隊(duì)在4小時內(nèi)通過對1.4萬多篇有關(guān)冠狀病毒文獻(xiàn)智能推理分析,最終得出病毒與ACE2之間的結(jié)合可能引發(fā)ACE2/AT2R的功能變化,使腎素——血管緊張素系統(tǒng)(RAS)參與的細(xì)胞因子調(diào)控軸發(fā)生穩(wěn)態(tài)失衡,并最終導(dǎo)致“細(xì)胞因子風(fēng)暴”的結(jié)論。團(tuán)隊(duì)認(rèn)為這可能是參與冠狀病毒感染后導(dǎo)致宿主病理性變化的重要調(diào)控因素,也得到了國內(nèi)三家權(quán)威機(jī)構(gòu)回顧性研究的確認(rèn)。該研究最近發(fā)表于《DRUG DEVELOPMENT RESEARCH》期刊。

大幅提速數(shù)據(jù)處理效能的高性能計(jì)算。團(tuán)隊(duì)擁有世界領(lǐng)先的并行優(yōu)化算法,在訓(xùn)練模型階段,團(tuán)隊(duì)用到了106G的數(shù)據(jù),調(diào)動 2000個CPU運(yùn)行半年。如果沒有并行優(yōu)化技術(shù),即使歷時數(shù)年也可能跑不出結(jié)果。對同一模型、同一數(shù)據(jù)量處理,如果直接在小型機(jī)上計(jì)算需要1萬小時,加載并行優(yōu)化技術(shù)后,計(jì)算時間可壓縮到100小時。高水平的并行優(yōu)化團(tuán)隊(duì)還能再獲得更大的效率收益。

渡過技術(shù)和數(shù)據(jù)積累期,TD-P平臺開放商業(yè)化服務(wù)

基于計(jì)算醫(yī)學(xué)的藥物Pattern發(fā)現(xiàn)引擎是否還是一個科研階段,能提供商業(yè)化解決方案嗎?

為了將“生物醫(yī)學(xué)信息處理系統(tǒng)”賦能產(chǎn)業(yè),中科院計(jì)算所孵化了哲源科技,對其研究成果進(jìn)行轉(zhuǎn)化,并聯(lián)合成立了“中國科學(xué)院計(jì)算技術(shù)研究所·哲源-圖靈-達(dá)爾文實(shí)驗(yàn)室”,致力于計(jì)算醫(yī)學(xué)的發(fā)展,通過藥物Pattern發(fā)現(xiàn)引擎TD-P平臺(Turing-Darwin Pattern Discovery Platform)賦能藥物研發(fā)、精準(zhǔn)醫(yī)學(xué)。該平臺已經(jīng)渡過了技術(shù)積累和數(shù)據(jù)積累期,具備了工業(yè)化服務(wù)能力。

第一,標(biāo)志物兼容性好;赥D-P平臺不僅可以發(fā)現(xiàn)定量性質(zhì)的,具有生物學(xué)意義的新型標(biāo)志物,同時也能向下兼容單分子生物標(biāo)志物。例如,該平臺與國內(nèi)著名PI在某一實(shí)體腫瘤化療藥物適應(yīng)人群判斷的合作中,最終收斂出能夠被PCR技術(shù)檢測的變異位點(diǎn),質(zhì)優(yōu)價廉,為IVD行業(yè)帶來全新解決方案。

第二,迅捷解決臨床問題。針對某一特定藥物研發(fā)與臨床應(yīng)用場景需求,只需要投入較少量的指定樣本數(shù)據(jù)在該技術(shù)平臺適配,即可以周為單位交付初步發(fā)現(xiàn)的標(biāo)志物。然后利用后續(xù)患者數(shù)據(jù)在該模型中做進(jìn)一步前瞻性預(yù)測,優(yōu)化模型精準(zhǔn)度。同樣在上述案例中,20個樣本規(guī)模即有初步發(fā)現(xiàn),用預(yù)測模型對上百個前瞻性樣本預(yù)測的陽性檢出率達(dá)70%。

image.png

場景專屬模型適配

第三,適用場景廣泛。平臺一體兩面,為藥找人,為人找藥。在藥物研發(fā)階段,可以協(xié)助新藥臨床場景的選擇、臨床試驗(yàn)入組優(yōu)化、適應(yīng)癥擴(kuò)展、跨線晉級。在臨床應(yīng)用階段,為患者匹配響應(yīng)度最佳、副作用最小的用藥方案,將醫(yī)生臨床實(shí)踐中已經(jīng)積累的寶貴的臨床治療方案和經(jīng)驗(yàn)發(fā)揮到極致,實(shí)施更加精準(zhǔn)的個體化治療。

image.png

廣泛的服務(wù)場景

發(fā)現(xiàn)CDK4/6抑制劑新場景

TD-P平臺是否能為業(yè)界帶來重磅驚喜?

CDK4/6抑制劑是針對CDK4和CDK6兩個蛋白的靶向藥物,主要應(yīng)用于激素受體陽性Her2陰性的乳腺癌患者群體。首款CDK4/6抑制劑“愛博新”2019年銷售額近50億美元。多家知名企業(yè)都在布局CDK4/6抑制劑,預(yù)計(jì)國內(nèi)競爭將很快達(dá)到白熱化。

不過即便使用了雌激素受體作為生物標(biāo)志物,仍有大約20%的患者最初不會對CDK4 / 6抑制劑產(chǎn)生反應(yīng),并且所有患者最終都有產(chǎn)生耐藥性的可能。其他一些相關(guān)臨床試驗(yàn)也曾嘗試過多種不同分子標(biāo)志物,都不盡人意?梢哉f,采用單分子作為標(biāo)志物的努力基本宣告失敗。誰能回答以下問題,誰就更有機(jī)會在白熱化競爭的市場中勝出。

1. 是否存在標(biāo)志物預(yù)測患者的藥物反應(yīng)?

2. 是否可與內(nèi)分泌療法以外的其他療法結(jié)合使用?

3. 是否可將適應(yīng)癥擴(kuò)大到其他癌種?

TD-P平臺在對CDK4/6抑制劑以往的研究數(shù)據(jù)和臨床情況分析后,已經(jīng)發(fā)現(xiàn)幾個其他癌種的患者同樣能從CDK4/6抑制劑中獲益,療效甚至可能優(yōu)于乳腺癌患者。哲源科技也希望能與CDK4/6抑制劑研發(fā)企業(yè)合作這一自有成果。TD-P平臺還在抗血管藥物、PD-1/PD-L1單抗等抗腫瘤藥物的伴隨診斷開發(fā)、全新臨床場景挖掘、臨床試驗(yàn)入組優(yōu)化方面有突破性發(fā)現(xiàn)。

從”三個10”到“三個5”

中國科學(xué)院計(jì)算技術(shù)研究所西部高等技術(shù)研究院常務(wù)副院長張春明向動脈網(wǎng)表示:“我們希望利用緊貼臨床的人工智能加速藥物研發(fā),大幅降低研發(fā)費(fèi)用。將十年研發(fā)周期、十億美金投入、10%臨床試驗(yàn)成功率的‘三個10’研發(fā)挑戰(zhàn),提高到‘三個5’,即5年研發(fā)、5億美金、50%的臨床試驗(yàn)成功率。”

利用大數(shù)據(jù)、人工智能、高性能計(jì)算組網(wǎng)的藥物研發(fā)與應(yīng)用的“北斗系統(tǒng)”為面臨困局的醫(yī)藥行業(yè)開啟了藥物精準(zhǔn)定位的新時代。制造出藥物已經(jīng)不是競爭的終點(diǎn),提速臨床試驗(yàn)、不斷拓展新適應(yīng)癥、為患者提供更精準(zhǔn)響應(yīng)的藥物、更好地利用真實(shí)世界數(shù)據(jù)才是未來的競爭制勝之道。“計(jì)算醫(yī)學(xué)”從數(shù)字生命的視角認(rèn)識疾病與藥物,協(xié)助開發(fā)特異性、有效性、安全性更好的藥物,帶來更精準(zhǔn)的“人藥匹配”,將會帶動醫(yī)藥行業(yè)新一輪的智能化升級。

作者:郝翰

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號