侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

蛋白質(zhì)的新“折疊”!DeepMind重磅推出家族新成員AlphaFold

人工智能領(lǐng)域第一大家族,來(lái)自DeepMind的Alpha家族最喜歡做的事情就是出其不意。

它們所有的小確幸都是,意料之中、精彩尤甚。

比如之前一戰(zhàn)成名的AlphaGo、后續(xù)傲嬌的AlphaZero,以及這兩天剛剛加入家族戰(zhàn)隊(duì)的AlphaFold,中文封號(hào)為,阿爾法折疊。

生物醫(yī)學(xué)領(lǐng)域,一向都是冷靜與熱情并存,而這位AI新寵兒AlphaFold的性格雖然還不明朗,但至少目前看來(lái),勢(shì)必會(huì)引發(fā)生物醫(yī)學(xué)領(lǐng)域新一輪的研究加速。

“小奇妙”阿爾法折疊

據(jù)DeepMind介紹,阿爾法折疊這項(xiàng)成果的重大意義就在于,你給它一段基因序列(生物學(xué)上稱(chēng)其為蛋白質(zhì)一級(jí)結(jié)構(gòu)),在電腦上跑一下,就可以成功對(duì)這種蛋白質(zhì)建模。

看似簡(jiǎn)單,但意義非凡。

在過(guò)去五十年,和阿爾法折疊起到相同功能的技術(shù)有冷凍電子顯微鏡、核磁共振或X射線晶體學(xué)等實(shí)驗(yàn)技術(shù)。單看儀器,它們就需要高昂的價(jià)格,但最重要的是,其實(shí)驗(yàn)成本也很高,需要專(zhuān)人做大量的實(shí)驗(yàn),器材損耗不說(shuō),實(shí)驗(yàn)用料就要花費(fèi)數(shù)萬(wàn)美元。

花錢(qián)不說(shuō),最主要的是,整個(gè)過(guò)程太慢,需要耗費(fèi)研究者幾年甚至數(shù)十年的光陰。

有了阿爾法折疊就不一樣了,生物學(xué)家再也不用在實(shí)驗(yàn)器材面前耗費(fèi)數(shù)十年的光陰,只需要簡(jiǎn)單錄入數(shù)據(jù)就好。

當(dāng)然,阿爾法折疊的好處不僅這么點(diǎn),最終它還是惠及到我們普羅大眾的身上。

以老年癡呆癥(學(xué)名為阿爾茨海默氏癥)為例,它在人體的潛伏期長(zhǎng)達(dá)十幾年之久,且病因復(fù)雜,以目前的醫(yī)學(xué)技術(shù),臨床上甚至很難在發(fā)病前幾年檢測(cè)出這一疾病。

在生物學(xué)研究上,科學(xué)家普遍認(rèn)為蛋白質(zhì)的變化是引發(fā)老年癡呆的病因。換句話(huà)說(shuō),老年癡呆患者的某一部分蛋白質(zhì)長(zhǎng)得一定和正常人不一樣。但是由于我們的研究速度太慢,所以生物學(xué)家不知道身體中所有的蛋白質(zhì)形態(tài),因此檢測(cè)哪一部分不一樣就難如登天。

想象一下,通過(guò)阿爾法折疊,提前十年檢測(cè)老年癡呆就容易多了,只要通過(guò)電腦看下蛋白質(zhì)長(zhǎng)得是否有差異就可以了。

人工智能對(duì)蛋白質(zhì)結(jié)構(gòu)的“深度寵愛(ài)”

這一次,讓阿爾法折疊一戰(zhàn)成名的還是一項(xiàng)比賽。

在1994年,為了促進(jìn)研究和衡量最新方法在提高預(yù)測(cè)準(zhǔn)確性方面的進(jìn)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)關(guān)鍵評(píng)估社區(qū)范圍實(shí)驗(yàn)(CASP)的雙年度全球競(jìng)賽被設(shè)立。演變至今,其比賽結(jié)果已經(jīng)成為行業(yè)標(biāo)準(zhǔn)。

雖然沒(méi)有AlphaGo當(dāng)年成名那么壯觀,但作為阿爾法家族的一員,阿爾法折疊一出手就是不凡。在今年的CASP比賽上,它不出所料的成功拿到了第一。

據(jù)DeepMind官網(wǎng)上的介紹,基于深度神經(jīng)網(wǎng)絡(luò),他們?cè)O(shè)計(jì)了兩種方法以用來(lái)構(gòu)建完整而精確的蛋白質(zhì)結(jié)構(gòu)。

首先,他們先采集氨基酸對(duì)之間的距離和連接這些氨基酸的化學(xué)鍵之間的角度數(shù)據(jù),接著將這些數(shù)據(jù)設(shè)計(jì)成用以評(píng)估蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確度的分析工具。

使用這一分析工具,研究團(tuán)隊(duì)想出第一種方法,就是在現(xiàn)有蛋白質(zhì)數(shù)據(jù)庫(kù)里找到最匹配的蛋白質(zhì),如果找不到,他們就基于最接近的搜索結(jié)構(gòu)上,用新的基因片段不斷替換,以創(chuàng)造出匹配要求的新結(jié)構(gòu)。

而這第二種方法要更簡(jiǎn)單一些。據(jù)他們介紹,研究人員主要用的就是梯度下降 -a數(shù)學(xué)技術(shù),它的精度相較于第一種會(huì)更高一些。相較于第一種方式,這種技術(shù)一步就可以預(yù)測(cè)整個(gè)蛋白質(zhì)鏈,而不用經(jīng)歷組裝的過(guò)程,整個(gè)過(guò)程更簡(jiǎn)單。

DeepMind沒(méi)有公布更多細(xì)節(jié),但經(jīng)過(guò)這樣“簡(jiǎn)單”的設(shè)計(jì),奇跡就這樣發(fā)生了。

最后,科普來(lái)了

在人體內(nèi),蛋白質(zhì)是一種神奇的存在。

眾所周知,蛋白質(zhì)是構(gòu)成人體結(jié)構(gòu)的主要成分,其含量?jī)H次于水,約占一個(gè)人體重的五分之一。我們身體所要執(zhí)行的幾乎所有功能,包括肌肉的收縮與拉伸、身體對(duì)光線的感知和食物的轉(zhuǎn)化,都需要蛋白質(zhì)在其中起關(guān)鍵作用。

而科學(xué)家指出,蛋白質(zhì)的結(jié)構(gòu)很大程度上決定了一種蛋白質(zhì)的特性,因此研究蛋白質(zhì)3D結(jié)構(gòu)的重要性就顯而易見(jiàn)了。在我們的身體里,這樣的案例比比皆是,如構(gòu)成我們免疫系統(tǒng)的抗體蛋白質(zhì)是“Y形”的;膠原蛋白的形狀像繩索;用于基因編輯的CRISPR和Cas9,它們則像剪刀一樣。

但是純粹從基因序列只能夠找出蛋白質(zhì)的三維形狀是一項(xiàng)復(fù)雜的任務(wù),按照傳統(tǒng)的研究方法,科學(xué)家需要從一級(jí)結(jié)構(gòu)、二級(jí)結(jié)構(gòu)來(lái)一層層研究,花費(fèi)幾十年甚至千百年才能夠完全建立蛋白質(zhì)的形態(tài)模型。

而阿爾法折疊的出現(xiàn),讓生物學(xué)家省去了不少功夫。

在DeepMind官網(wǎng)上,他們是這么介紹這一重大成果的面世的:“我們很高興與大家分享DeepMind在展示人工智能研究如何推動(dòng)和加速新科學(xué)發(fā)現(xiàn)方面的第一個(gè)重要里程碑。DeepMind匯集了來(lái)自結(jié)構(gòu)生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專(zhuān)家們,通過(guò)跨學(xué)科方式將尖端技術(shù)運(yùn)用其中,設(shè)計(jì)出了僅根據(jù)其基因序列就可以預(yù)測(cè)蛋白質(zhì)3D結(jié)構(gòu)的AlphaFold!

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)