侵權(quán)投訴
訂閱
糾錯
加入自媒體

臨床基本信息當(dāng)作變量輕松發(fā)2+分專業(yè)期刊

2021-02-03 08:37
科研菌
關(guān)注

       今天要和大家分享的是一篇2+分的學(xué)習(xí)筆記。這篇學(xué)習(xí)筆記使用了GEO數(shù)據(jù)庫的數(shù)據(jù),進(jìn)行了差異表達(dá)基因的篩選、GO和KEGG富集分析、PPI網(wǎng)絡(luò)分析,確定了阿爾茨海默病(Alzheimer’s disease,AD)發(fā)病過程中關(guān)鍵的差異表達(dá)基因(DEGs)和通路,找到了AD的潛在生物標(biāo)志物。

題目:阿爾茨海默病不同腦區(qū)異常調(diào)控基因和通路的鑒定

圖片標(biāo)題

一、 研究背景

阿爾茨海默病(Alzheimer disease,AD)是一種慢性進(jìn)行性神經(jīng)退行性疾病。目前對AD的病理生理機(jī)制尚未完全了解。所以這篇學(xué)習(xí)筆記對阿爾茨海默病患者和正常對照的腦組織(包括海馬組織—HIP、顳回組織—TG、額回組織—FG和全血—WB)的可用基因表達(dá)譜進(jìn)行了綜合分析。以確定阿爾茨海默病發(fā)病機(jī)制中的關(guān)鍵差異表達(dá)基因和途徑,獲得潛在的阿爾茨海默病診斷生物標(biāo)志物,為今后研究中阿爾茨海默病診斷生物標(biāo)志物和治療靶點(diǎn)的確定提供有價值的信息。

二、分析流程

三、結(jié)果解讀1. 鑒定差異表達(dá)基因(DEGs)

       從GEO數(shù)據(jù)庫中篩選16個數(shù)據(jù)集,包括海馬組織(HIP)六個、顳回組織(TG)三個、額葉回組織(FG)三個和全血(WB)四個,詳細(xì)信息如表1所示。篩選標(biāo)準(zhǔn)為:

數(shù)據(jù)集為全基因組表達(dá)數(shù)據(jù)(數(shù)據(jù)完整)

數(shù)據(jù)庫來源于所需要研究的組織(數(shù)據(jù)與研究相關(guān))

表1. 數(shù)據(jù)集的詳細(xì)信息

       由于在HIP、TG和FG組織中的比較數(shù)據(jù)來源于多個數(shù)據(jù)集,所以需要對這些數(shù)據(jù)使用了log2轉(zhuǎn)換進(jìn)行歸一化處理,并且使用R包 metaMA合并這些數(shù)據(jù)集。接著計算單個基因的p值,并使用Benjamini & Hochberg法計算多重比較校正的錯誤發(fā)現(xiàn)率(FDR),然后篩選出FDR < 0.01的基因,于是得到了DEGs。

       為了驗證在這三個組織中,對照組和AD組的基因的表達(dá)是存在差異的,于是利用這些數(shù)據(jù)繪出在三個組織中的基因表達(dá)熱圖。

熱圖的紅色代表了上調(diào)表達(dá),綠色代表了下調(diào)表達(dá)。以TG組織為例,可以看到在TG中表達(dá)的基因大致可以分成兩類:一類是上面一組,代表了對照組高表達(dá)而AD組低表達(dá)(左上紅色塊和右上綠色塊);一類是下面一組,代表了對照組低表達(dá)而AD組高表達(dá)(左下綠色塊和右下紅色塊)。

圖1. 在三個組織中的差異表達(dá)基因DEGs熱圖

       從三個組織篩選得到的所有數(shù)據(jù)集中篩選出了325個DEGs。篩選標(biāo)準(zhǔn)為:FDR <0.01(FDR是指錯誤發(fā)現(xiàn)率,一般取FDR<0.01作為默認(rèn)標(biāo)準(zhǔn))。圖2中,三個組織樣本中的差異表達(dá)基因的交集即為3個組織樣本中表達(dá)均有差異的基因(上調(diào)的117個,下調(diào)的148個,總共325個)。

圖2. 篩選得到的上調(diào)和下調(diào)表達(dá)的DEGs

2. GO和KEGG富集分析

       使用Gene codis 3軟件對未與全血樣本重合的325個DEGs進(jìn)行富集分析(FDR < 0.05)。富集結(jié)果如下圖3所示。從圖中可以看到這些基因在與AD有關(guān)的信號通路中出現(xiàn)了顯著的富集,比如:在HIP中,參與粘附體連接的途徑;在FG中,Wnt信號通路;此外,MAPK信號通路也出現(xiàn)了明顯的富集。

圖3. KEGG富集分析結(jié)果

       325個DEGs的GO和KEGG富集分析的詳細(xì)結(jié)果如下表所示(表2)。從GO分析結(jié)果可以看出這些基因在凋亡過程調(diào)節(jié)、凋亡過程和細(xì)胞死亡等基因功能出現(xiàn)了明顯的富集。

表2. GO和KEGG富集分析表

3. PPI網(wǎng)絡(luò)構(gòu)建

       利用BioGRID數(shù)據(jù)庫和Cytoscape軟件構(gòu)建來PPI網(wǎng)絡(luò),尋找核心調(diào)控基因(hub genes)。利用前20個上調(diào)和下調(diào)基因來構(gòu)建PPI網(wǎng)絡(luò)。

小編以HIP為例(圖4)進(jìn)行說明:圖中紅色的圓點(diǎn)代表了上調(diào)表達(dá)的基因,藍(lán)色的圓點(diǎn)代表了下調(diào)表達(dá)的基因,三角形基因代表了與其它基因連接度高的基因。PPI網(wǎng)絡(luò)篩選核心調(diào)控基因的原理也就是根據(jù)一個基因和其余基因的連接度(connectivity)的大小來篩選的,簡而言之就是圖中基因周圍線最多的基因就是我們需要尋找的核心調(diào)控基因。

圖4. 根據(jù)HIP的DEGs構(gòu)建的PPI網(wǎng)絡(luò)

       通過在HIP、TG、FG的PPI網(wǎng)絡(luò)中的基因進(jìn)行連接度從高到低排序,可以得到以下結(jié)果:

在HIP的PPI網(wǎng)絡(luò)中,YAP1的連接度最高,與18個DEGs相互作用;

在TG的PPI網(wǎng)絡(luò)中,MAPK9的連接度最高,與16個DEGs相互作用;

在FG的PPI網(wǎng)絡(luò)中,GJA1的連接度最高,與6個DEGs相互作用。

4. 在全血樣本中尋找DEGs

       為了尋找血液中的生物標(biāo)志物,需要單獨(dú)對全血樣本進(jìn)行差異表達(dá)基因DEGs的篩選,篩選方法同上。作者總共篩選到了2101個DEGs,并將HIP、TG、FG和WB共有的DEGs篩選出來,總共篩選到了40個DEGs(圖5)。

圖5. 全血標(biāo)本中基因表達(dá)熱圖(A);利用韋恩圖篩選4個組織樣本中共有的差異表達(dá)基因(B)

       進(jìn)一步將四個組織樣本中共有的40個DEGs進(jìn)行富集分析。這些DEGs在脂肪細(xì)胞因子信號通路、細(xì)胞因子-細(xì)胞因子受體相互作用和阿爾茨海默病相關(guān)通路出現(xiàn)了顯著的富集(圖6)。

圖6. 40個DEGs的富集結(jié)果

       構(gòu)建PPI網(wǎng)絡(luò)發(fā)現(xiàn),在WB的PPI網(wǎng)絡(luò)中,TNFRSF1A和MAP3K5的連接度最高,分別與152個和76個DEGs有相互作用(圖7)。

圖7. 根據(jù)WB的DEGs構(gòu)建的PPI網(wǎng)絡(luò)

4. 驗證

       這一部分分為兩步

       第一步的思路是:使用驗證集進(jìn)行DEGs的篩選,并與之前篩選得到的40個DEGs進(jìn)行對比,驗證之前篩選得到的DEGs與驗證集是否一致,同時篩選HIP、TG、FG、WB以及驗證集中表達(dá)都有顯著差異的基因用于下一步驗證。

       第一步的詳細(xì)過程為:利用腦組織HIP的驗證集GSE1297篩選到了35個DEGs,并比較這35個基因中31個常見的基因與之前篩選得到的40個DEGs的基因表達(dá)情況,發(fā)現(xiàn)它們的表達(dá)上調(diào)或下調(diào)情況一致。然后篩選了HIP、TG、FG、WB以及驗證集中表達(dá)都有顯著差異的基因14個(圖8),這些DEGs包括:

顯著上調(diào)表達(dá)的:ARHGEF40、WWC3、VCAN、SSH3、SAFB2、LRCH4、IL10RA、CDK13、BBX和SPSB3;

顯著下調(diào)表達(dá)的:MRPL15、COPS3、TXNDC9和RAD51C

圖8. 差異表達(dá)基因在正常組織和AD患者HIP組織中的表達(dá)情況(箱線圖左邊代表正常組織,右邊代表了AD患者的HIP組織)

       第二步的思路是:對篩選的到的DEGs的診斷價值進(jìn)行驗證。

       第二步的詳細(xì)過程為:利用全血樣本W(wǎng)B的驗證集GSE63060和GSE63061對上述驗證過程中篩選得到的14個DEGs進(jìn)行了ROC分析。ROC曲線由pROC繪出,使用AUC(ROC曲線下面積)以評估各DEG的診斷價值,當(dāng)AUC值大于0.6時,認(rèn)為DEG能夠區(qū)分病例和正常對照。結(jié)果發(fā)現(xiàn)在這14個DEGs中只有MRPL15、RAD51C、SAFB2、SSH3、TXNDC9、VCAN和WWC3能夠區(qū)分AD患者與健康對照的WB樣本(圖9)。

圖9. 7個DEGs的ROC曲線

小結(jié)

       這篇學(xué)習(xí)筆記先是篩選出AD的HIP、TG和FG組織中的DEGs;然后進(jìn)行GO和KEGG富集分析;接著構(gòu)建了PPI網(wǎng)絡(luò),發(fā)現(xiàn)YAP1、MAPK9和GJA1是HIP、TG和FG組織中的核心調(diào)控基因。為了在血液中尋找生物標(biāo)志物,在WB、HIP、TG和FG找到了表達(dá)都有顯著差異的40個DEGs;下一步利用驗證集對40個DEGs進(jìn)一步進(jìn)行篩選,找到了14個DEGs;最后驗證了這14個DEGs的診斷價值,發(fā)現(xiàn)有7個DEGs可以作為診斷標(biāo)志物。這篇學(xué)習(xí)筆記的套路簡單易懂,值得我們學(xué)習(xí)。

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號