基因測序性能提升5倍,華為云FPGA基因加速方案彰顯技術(shù)創(chuàng)新能力
近期,華為云攜手峰科計算(以下簡稱“峰科”)發(fā)布基于FPGA的基因加速云解決方案,該方案采用GATK(The Genome Analysis Toolkit)標準分析流程,將全基因組測序(WGS)性能提升5倍,比傳統(tǒng)模式提升3~5倍,同時測序精度可達99.95%以上,在大幅縮短測序時間的同時實現(xiàn)TCO大幅降低。
基因測序數(shù)據(jù)分析加速面臨的挑戰(zhàn)
首先,基因測序分析流程BWT+GATK當前被業(yè)界廣泛采納,但采用此流程的傳統(tǒng)測序方法需要消耗高額算力及存儲資源,且耗時較長。
其次,針對基因測序中高算力需求的smith-waterman,pair-h(huán)mm等算法處理,其具有計算并行性,不連續(xù),非規(guī)則的存儲訪問,低bit操作等特性,計算依賴不規(guī)則區(qū)域的操作會對CPU消耗很大,性能難以提升。
華為云FPGA基因加速解決方案的三大優(yōu)勢
為了更好的解決基因測序行業(yè)面臨的基因組分析標準流程不經(jīng)濟高效,以及跨不同云和硬件(CPUs,F(xiàn)PGAs)加速實現(xiàn)的雙重挑戰(zhàn)。華為云和峰科計算強強聯(lián)合,合作推出符合行業(yè)標準的GATK加速流程,通過對基因測序數(shù)據(jù)分析流程進行軟、硬件聯(lián)合優(yōu)化實現(xiàn)端到端加速。華為云FPGA基因加速方案具備如下優(yōu)勢:首先,華為云提供業(yè)界領(lǐng)先的FPGA加速云服務(wù)平臺,采用業(yè)界領(lǐng)先的Xilinx 16nm Virtex UltraScale+ VU9P FPGA,并針對基因場景推出32核CPU224GB內(nèi)存1 VU9P FPGA和64核CPU448GB內(nèi)存2 VU9P FPGA規(guī)格的實例,實現(xiàn)了GATK軟件處理流程和FPGA加速流程的完美結(jié)合,從而將加速效率提升3~5倍。
其次,峰科采用GATK標準分析流程,精準性與GATK標準流程完全吻合,精度可達99.95%以上。
第三,不修改GATK標準流程,可訪問讀取從原始測序數(shù)據(jù)到生成vcf文件整個過程中的中間數(shù)據(jù),便于科研用戶使用比對。
1. 華為云FPGA基因加速解決方案解析
華為云FPGA基因加速解決方案集成峰科的加速IP,為用戶提供一種易于使用,經(jīng)濟實惠的基于FPGA的基因組分析流程加速服務(wù),在該方案中,華為云配備了32核CPU,單個VU9P FPGA的實例。華為云FPGA基因加速解決方案使用GATK最佳方案對種系突變和體細胞突變進行變異檢測,將計算密集型算法如Smith-Waterman、PairHMM等確定為加速對象。每種算法都經(jīng)過FPGA內(nèi)核優(yōu)化,并且實現(xiàn)CPU-FPGA協(xié)同執(zhí)行和資源分配。如圖2所示,用戶通過分析應(yīng)用程序,把每個流程的數(shù)據(jù)傳給華為云峰科加速平臺,平臺里的Kestrel運行時管理工具來管理CPU-FPGA協(xié)同執(zhí)行和資源分配。利用多線程,I / O優(yōu)化和擴展使用FPGA加速器,華為云FPGA基因加速服務(wù)的基因組學分析流程在保證精準度情況下提供顯著的加速。
華為云FPGA基因加速方案結(jié)構(gòu)圖
與GATK最佳使用流程相對稱,典型的基因測序數(shù)據(jù)分析流程始于原始FASTQ序列兩端讀長(paired-end reads),進一步獲取一組經(jīng)過濾的變體,對其進行標記以供進一步分析。圖3描述了華為云基因加速服務(wù)種系變異調(diào)用流水線的具體流程,中間面板指示開始的通常工作流程,上下分別顯示華為云FPGA基因加速方案中的峰科加速流程和GATK最佳使用流程命令實現(xiàn)方式的工作流程。
華為云峰科基因加速流程和GATK最佳使用流程對比
基于華為云FPGA加速服務(wù),使用FPGA優(yōu)化加速GATK流程,基因組分析流程可以實現(xiàn)3~5倍速度提升和99.95%以上的準確度。華為云FPGA基因加速解決方案最快基因組序列分析標準流程可在一天內(nèi)完成5個全基因組或24個整體外顯子組分析。
Performance comparison for GATK 3.8 WGS from Alignment to Variant Calling using Hoplotypecaller
Cloud based comparisonTotal(Hrs.)Speedup
WGS(30X)Falcon on Huawei7.464.84x
Original 36.11x
注:測試數(shù)據(jù)使用的是30X的WGS樣本,堿基數(shù)量103G華為云基因加速服務(wù)“0”元體驗
為了能讓更多的用戶體驗華為云FPGA加速云服務(wù)器,針對基因加速場景,華為云聯(lián)合峰科(Falcon)推出“基因加速服務(wù)0元體驗套餐”,套餐規(guī)格為32核CPU224GB內(nèi)存500GB數(shù)據(jù)盤5M帶寬。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
11月19日立即報名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月29日立即預(yù)約>> 【上海線下】設(shè)計,易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟產(chǎn)業(yè)大會暨展覽會
-
精彩回顧立即查看>> 全數(shù)會2024中國人形機器人技術(shù)創(chuàng)新發(fā)展大會
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
-
10 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市