訂閱
糾錯
加入自媒體

英矽智能任峰:數(shù)據(jù)與算法優(yōu)化是AI新藥研發(fā)的壁壘,藥企對AI制藥的態(tài)度更加開放

英矽智能與復星醫(yī)藥的合作或?qū)㈤_啟AI制藥與藥企合作的轉(zhuǎn)折點。

本文為IPO早知道原創(chuàng)

作者|羅賓

微信公眾號|ipozaozhidao  

據(jù)IPO早知道消息,上海復星醫(yī)藥(集團)股份有限公司(下稱“復星醫(yī)藥”,600196.SH,02196.HK)與端到端人工智能驅(qū)動的藥物研發(fā)公司英矽智能(Insilico Medicine)于1月10日宣布達成合作協(xié)議,在全球范圍內(nèi)共同推進多個靶點的AI藥物研發(fā)。

《IPO早知道》對話了英矽智能首席科學官任峰博士,他結(jié)合此次合作分析了AI制藥行業(yè)最新的變化。

英矽智能首席科學官任峰博士(來源:受訪者提供)

任峰表示:“以往藥企對于AI賦能新藥研發(fā)抱有試探性的態(tài)度,但現(xiàn)在越來越開放地進行共同的研發(fā)。這次合作從規(guī)模和首付款金額上看都是業(yè)內(nèi)迄今最大的一次合作,我希望這次合作也能推動傳統(tǒng)藥企今后在與AI企業(yè)的合作上有更大的決心和步伐!

此次戰(zhàn)略合作包括針對四個指定靶點的以人工智能驅(qū)動的藥物研發(fā)合作,以及雙方對于英矽智能QPCTL項目的共同開發(fā)合作。根據(jù)協(xié)議,英矽智能將獲得1300萬美元的首付款,及里程碑式付款,并分享QPCTL項目的商業(yè)化利潤。此外,復星醫(yī)藥將向英矽智能提供股權(quán)投資。

根據(jù)合作協(xié)議,英矽智能將負責為QPCTL項目提名臨床前候選藥物,并將該候選藥物推進到臨床前階段,之后復星醫(yī)藥將對其展開臨床階段研究,共同推進該項目在全球范圍內(nèi)的開發(fā)。同時,復星醫(yī)藥的研發(fā)團隊將提名四個靶點,由英矽智能的人工智能平臺和研發(fā)團隊進行評估和開發(fā),并將候選藥物推進到臨床前階段。作為合作的一部分,復星醫(yī)藥將獲得英矽智能人工智能平臺PandaOmics和Chemistry42的使用權(quán),以推進公司內(nèi)部人工智能驅(qū)動的藥物發(fā)現(xiàn)和開發(fā)工作。

任峰表示,盡管很多AI公司都取得了進展,但AI還是個新事物,目前也沒有任何一家AI公司可以證明它的算法是最好、最正確的。只有保持算法的優(yōu)化能力,AI賦能藥物研發(fā)的公司才能維持自己的競爭力,而算法優(yōu)化的能力需要經(jīng)過長時間的驗證、積累,所以難以被復制。此外,數(shù)據(jù)的標準化也是這個行業(yè)中的企業(yè)壁壘。所以未來AI公司的競爭會從單純的算法、項目層面的競爭進化為數(shù)據(jù)獨特性的競爭。

以下是《IPO早知道》精編整理的對話內(nèi)容:

Q:IPO早知道

A:任峰

Q:英矽智能此次與復星醫(yī)藥的合作背景、雙方價值與能力的匹配點是什么?

A:這次合作以股權(quán)投資加項目合作的方式展開,包括QPCTL項目的共同開發(fā)。QPCTL之前是我們內(nèi)部的一個自研項目,QPCTL是CD47信號通路中的一個靶點,我們在針對此靶點的早期動物實驗中看到它對癌癥的免疫治療有非常好的效果。復星看到了此項目的價值,同時也想利用我們的人工智能平臺賦能他們希望推進的另外幾個靶點,所以在這個背景下雙方達成了這次的研發(fā)合作。在AI制藥公司與藥企的臨床前合作項目中,我們此次合作無論是從規(guī)模還是首付款都是至今最大的,可以說開創(chuàng)了一個先河。雙方進行了很充分的溝通,復星不僅認可我們的在研項目,也認可我們端到端的藥物研發(fā)平臺及我們的團隊,通過股權(quán)投資的形式,希望能跟我們一起成長,而復星的臨床研究和后續(xù)商業(yè)化實力很強,與我們能形成優(yōu)勢互補。

Q:藥企對AI制藥的態(tài)度從謹慎轉(zhuǎn)變到更大規(guī)模的合作,對行業(yè)的未來影響會是什么?

A:我們相信這對行業(yè)是很大的利好。去年以來,我們陸續(xù)看到國外的大藥企與AI制藥公司達成重磅合作,這代表這大藥企對AI制藥的態(tài)度越來越開放。相對來說,國內(nèi)藥企和AI制藥的合作還處在試水階段,合作規(guī)模小、項目數(shù)量少、首付款較低,藥企希望看到一些里程碑進展后再擴大合作金額和規(guī)模。本次我們的合作伙伴復星醫(yī)藥對于創(chuàng)新性的藥物研發(fā)有魄力和遠見,例如,它也是國內(nèi)第一個引進CAR-T項目的企業(yè)。我希望我們這次的合作能夠?qū)鴥?nèi)AI制藥領(lǐng)域有一定的推動作用,希望大家對國內(nèi)藥企和AI制藥公司之間的合作模式有新的思考,希望它們在AI賦能新藥研發(fā)上步子邁得更大一些,合作方式的改變對新藥研發(fā)行業(yè)來說也是很大的助力。

Q:英矽智能如何選定與藥企的合作內(nèi)容確保大家目標的一致性?

A:首先我們傾向于尋找與我們的資源優(yōu)勢互補的藥企,比如在臨床前評價、臨床試驗或商業(yè)化上有優(yōu)勢的企業(yè),我們能很好地展開互補協(xié)作。第二,我們希望選擇雙方都感興趣的合作項目,這樣可以保證項目的持續(xù)推進,不會因為一方的中途退出導致項目擱淺。第三,我們也希望能研究一些真正能解決未滿足的臨床需求的項目,而非純粹拼速度的項目,避免不必要的競爭,把資源集中用到真正需要的地方。

Q:我們有端到端的AI藥物研發(fā)平臺,其研發(fā)鏈條中所訓練數(shù)據(jù)的標準化程度現(xiàn)在發(fā)展到哪了?

A:現(xiàn)在標準化還并不成熟,因為不同實驗室或是不同的公司數(shù)據(jù)標準化程度都不一樣,這就為我們用大數(shù)據(jù)去訓練AI模型造成了一定挑戰(zhàn)。當然我們有自己的解決方案,比如我們通過轉(zhuǎn)錄組學的公開數(shù)據(jù)庫來訓練靶點發(fā)現(xiàn)平臺。我們的生物信息團隊會把我們認為能用、好用的數(shù)據(jù)進行過濾和標準化處理轉(zhuǎn)化成機器可讀的格式,來進行機器學習。

在轉(zhuǎn)錄組學數(shù)據(jù)處理過程中我們不能把來源不同的數(shù)據(jù)直接整合到一起,而是分成了不同模塊的數(shù)據(jù),避免數(shù)據(jù)之間的相互污染。雖然數(shù)據(jù)總量很大,但我們是通過小塊學習來訓練我們的模型的,否則容易出問題。這也是一種聯(lián)邦學習的方法。

Q:現(xiàn)在AI算法迭代的頻率有變化了嗎?

A:我們認為反而不是“迭代”這個詞,而是“淘汰”這個詞。以我們的Chemistry42平臺為例,我們自己從2016年開始做化學方面的算法,剛開始我們發(fā)展了170多種算法去產(chǎn)生小分子化合物,我們基本上把當時能想到的算法都包括了。后面我們通過自研項目和對外合作,發(fā)現(xiàn)在170多種算法里有140多種沒有產(chǎn)生過所需要的小分子化合物,于是我們將它們淘汰掉,留下約30種算法,它們持續(xù)幫我們產(chǎn)生有用的化合物。可能再過幾年,算法會繼續(xù)縮減,這樣命中率也會越來越高,因為產(chǎn)生不理想結(jié)果的算法被淘汰掉了。另一方面,我認為所謂迭代,很難去加入新的算法,雖然我們也在嘗試加入,但這些新算法還是要通過試驗來證明它是好是壞,這又需要三四年的時間。總結(jié)來看,這是以不斷驗證為前提,留下或淘汰算法的過程。

Q:經(jīng)過驗證的時間本身也是我們的一種競爭的壁壘。

A:是的,理論上AI公司用的都是公開數(shù)據(jù),底層算法也沒有專利保護,大家都能做數(shù)據(jù)的訓練,這方面壁壘很小,但我們有的更多是know-h(huán)ow的壁壘,我們的算法從170種濃縮到30種,但這個過程是難以復制的,大家的命中率就產(chǎn)生了差別。

另一點還是數(shù)據(jù)的壁壘。我們剛討論的轉(zhuǎn)錄組學數(shù)據(jù)雖然是公開的,但我們生物信息團隊花了將近7年時間完成可用數(shù)據(jù)的篩選和一些標準化的過程。雖然大家都想做這樣的處理,但都是需要投資時間、精力和財力的。

Q:我們的新靶點、疑難靶點發(fā)現(xiàn)方面,如何基于優(yōu)勢立項管線?

A:我們是AI賦能的新藥研發(fā)公司,所以潛在項目首先是要我們的靶點發(fā)現(xiàn)平臺能夠賦能的靶點,具體來說我們可以利用患者的轉(zhuǎn)錄組學數(shù)據(jù)來尋找新的靶點。我們選擇的靶點中百分之70-80%是有臨床I期或II期試驗結(jié)果的靶點,20%左右是全新靶點,這樣可以平衡我們的風險和收益。在這百分之70-80%的靶點里,我們通過自己的數(shù)據(jù)處理,識別出它目前在臨床階段的化合物哪些有缺陷,然后我們會針對有缺陷的化合物進行改造,以此來確定要選擇的靶點。

Q:中國的AI制藥在人才、資金上都比以前到位了,現(xiàn)在決定AI企業(yè)進步速度的是什么?未來會有馬太效應(yīng)嗎?

A:馬太效應(yīng)是會有的,相對頭部的公司規(guī)模更大的話有利于它吸引人才和資金。但另一方面,AI還是個新事物,到目前為止沒有任何一家AI制藥公司可以百分之百證明它的算法是最好的,是完全正確的,所以后來者也有機會去趕超。雖然有的公司是近兩年才成立的,但它有可能因此避免掉很多更早的AI公司所走過的彎路。而且算法更新的永遠是更好的,一家獨大的機會在這個領(lǐng)域不容易出現(xiàn)。暫時領(lǐng)先的公司需要通過不斷優(yōu)化自己的算法去保持競爭上的優(yōu)勢,而后來者如果專注于它所擅長的領(lǐng)域,有可能它的算法能變成某一領(lǐng)域最好的。

而且再往后發(fā)展,AI公司的競爭會從單純的算法、項目層面的競爭進化為數(shù)據(jù)之間的競爭,我們可以看到很多AI公司已經(jīng)開始想辦法收集自己獨有的數(shù)據(jù),也就是按照自己的算法需求處理的數(shù)據(jù),保證自己數(shù)據(jù)的獨特性,比如我們自己的轉(zhuǎn)錄組學數(shù)據(jù)。

Q:除了公開數(shù)據(jù),我們與藥企合作時使用的數(shù)據(jù)會幫助我們提升算法嗎?

A:這種數(shù)據(jù)分享情況很少,因為通常我們與藥企的協(xié)議有很強的排他性,也就是說我們不能把這一次合作中的數(shù)據(jù)應(yīng)用在其他的任何項目中。

Q:薛定諤等物理計算的AI企業(yè)也有自己的商業(yè)模式,也獲得了中國藥企合作。物理計算、AI計算兩種AI技術(shù)路徑將分別發(fā)揮什么作用?

A:這個問題本質(zhì)上是CADD和AIDD的區(qū)別。薛定諤的軟件基于量子力學的計算,比如薛定諤可以把小分子和蛋白之間的能量計算得非常精確,它是把已經(jīng)生成的小分子與蛋白質(zhì)的結(jié)合做一些排序,屬于CADD(計算機輔助藥物設(shè)計)的范疇。而AIDD(AI驅(qū)動的藥物設(shè)計)不涉及量子力學計算,它是對已知規(guī)律的歸納總結(jié)。

AIDD的輸入端是某種化合物結(jié)構(gòu),機器學習能夠總結(jié)某種結(jié)構(gòu)對應(yīng)某種活性并演繹出來,所以計算的產(chǎn)出就是幫助我們設(shè)計出更好的小分子化合物。比如針對一個蛋白,我們的Chemistry42能產(chǎn)生上百到上千個能跟其結(jié)合的小分子化合物,但是它們的結(jié)合能力有多強,可以由CADD的方法對這上千個的化合物進行排序。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號