基因測序是否準確,這篇文章從原理講清楚了!
Sanger雙脫氧鏈終止法是根據(jù)核苷酸在某一固定的點開始,隨機在某一個特定的堿基處終止,并且在每個堿基后面進行熒光標記,產(chǎn)生以A、T、C、G結(jié)束的四組不同長度的一系列核苷酸,然后在尿素變性的PAGE膠上電泳進行檢測,從而獲得可見DNA堿基序列的一種方法。
一代測序結(jié)果圖,橫軸是電泳時間,縱軸是熒光強度,橫軸也是堿基的先后次序。峰越高、越尖,與別的峰交錯越少,則這個堿基判讀準確性越好。結(jié)果肉眼可見,直觀而準確。
二代測序:第二代DNA測序技術(shù)又稱高通量測序技術(shù)(High-throughput sequencing, HTS),以低成本、較高的準確度,一次可對幾百、幾千個樣本的幾十萬至幾百萬條DNA分子同時進行快速測序分析。這一時期的代表技術(shù)有 Roche公司的454(已退市)、Illumina公司的Solexa(已升級到Novaseq,市場份額第一)和ABI公司的SOLID(由ThermoFisher公司收購,已升級到Ion Torrent S5),由于該時期的測序技術(shù)十分前沿,因而市場主要被這三家公司所壟斷。其測序技術(shù)復(fù)雜,生成測序文件數(shù)據(jù)量巨大,后續(xù)生物信息處理難度高,因此近5年才逐步進入臨床,且多用于腫瘤精準用藥的部分。
以illumina為例,我們簡單介紹一下其測序流程。
①將目的DNA分子打斷成100-200 bp的片段,隨機連接到固相基質(zhì)上,經(jīng)過Bst聚合酶延伸和甲酸胺變性的橋PCR循環(huán),生成大量的DNA簇(DNA cluster),每個DNA 簇中約有超過1000個相同序列的DNA片段。
②之后的反應(yīng)與Sanger法類似,加入用4種不同熒光標記并結(jié)合了可逆終止劑的dNTP。固相基質(zhì)上每個孔有八道獨立檢測的位點,所以一次可以并行八個獨立文庫,可容納數(shù)百萬的模版克隆,可把多個樣品混合在一起檢測,每個固相基質(zhì)上一次可讀取10億個堿基。
③DNA簇與單鏈擴增產(chǎn)物的通用序列雜交,由于終止劑的作用,DNA聚合酶每次循環(huán)只延伸一個dNTP。每次延伸所產(chǎn)生的光信號被標準的微陣列光學(xué)檢測系統(tǒng)分析測序,下一次循環(huán)中把終止劑和熒光標記基團裂解掉,然后繼續(xù)延伸dNTP,實現(xiàn)了邊合成邊測序技術(shù)。
④其主要的缺點是由于光信號衰減和移相的原因使得序列讀長較短,可以進行每個DNA測序片段的閱讀長度較短,目前主流且成本最低的就是做雙端測序150bp(PE150)。我們測全外顯子組的策略也是PE150。
二代測序原理,通過簇生成,CCD捕獲結(jié)合到模板的dNTP發(fā)的熒光,確定其DNA序列。
二代測序完成后,由于數(shù)據(jù)量巨大,復(fù)雜和多樣,因此,結(jié)果是肉眼不可見的,需要專業(yè)的算法、流程將原始數(shù)據(jù)處理為可用的數(shù)據(jù)。可比喻為,測序只是去菜場買菜,算法則是把菜做成大餐的過程。這個過程需要超級計算機,建立好的優(yōu)秀算法以及精通生物信息學(xué)分析的人員。
二代測序分析流程中,需要將原始測序數(shù)據(jù)進行質(zhì)控后生成一系列的中間文件(左圖),通過繁瑣的生物信息學(xué)流程(中圖),最后拼接成我們想要的基因。目前全流程多用Python和Perl語言在服務(wù)器上實現(xiàn)(右圖)。
二代測序由于其原理的一些問題,導(dǎo)致必須同一個位點測多次,才能保證數(shù)據(jù)的可靠性。一般用于臨床的數(shù)據(jù),需要同一位點測序后出現(xiàn)200次以上。我們將這樣的方案叫做測序深度(>200 X)。二代測序的優(yōu)勢是巨大的,其數(shù)據(jù)量巨大,可短時間高效率對人類基因組測序,并發(fā)現(xiàn)大量未知位點。單個位點成本降低,是個性化醫(yī)療和精準用藥的基礎(chǔ)。
最后,還有一種類似測序的工具,叫做基因芯片;蛐酒脑褪80年代中期提出的;蛐酒臏y序原理是雜交測序方法。目前由國內(nèi)外幾家大廠家所壟斷。其優(yōu)點是信息量較大,比一代測序的識別位點極大提升,可批量化生產(chǎn)并有完全標準流水線工作。但其缺點也很明顯,成本仍較高,無技術(shù)門檻,只檢測已選擇好的位點,更新位點的時間和經(jīng)費成本較高。比如illunima公司的ASA芯片,就是在一塊芯片上集成了66萬個人類基因組位點,檢測信息量大約30m左右。
2001年,通過一代測序,耗資37億美元,耗時13年,獲得了人類基因組草圖。到了2007年,用二代測序完成第一個完整的人類基因組序列圖譜只花費了150萬美元,耗時3個月。到了2020年,人類基因組測序只需要不到1萬元人民幣即可完成測序工作,時間只需要3天。近年來,測序技術(shù)突飛猛進,隨著測序單價的不斷降低,我們必將見證人人都有“基因身份證”的那一天。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市