企業(yè)存儲(chǔ)告別“傻大黑粗”,華為存儲(chǔ)引領(lǐng)AIOps創(chuàng)新
如果將工業(yè)設(shè)備與一臺(tái)閃存陣列放在一起,會(huì)發(fā)生什么?你可能想象不到,日久天長(zhǎng),閃存控制器中的線路板可能會(huì)被慢慢腐蝕甚至溶解。若恰巧這臺(tái)“傻大黑粗”的閃存陣列并不具備智能化的故障預(yù)測(cè)功能,當(dāng)系統(tǒng)中斷或發(fā)生數(shù)據(jù)丟失時(shí)才被用戶察覺,一切將為時(shí)晚矣。
你也許會(huì)說,上述只是極端的例子或小概率事件,但是隨著業(yè)務(wù)互聯(lián)網(wǎng)化和移動(dòng)化趨勢(shì)的加劇,很多行業(yè)的銷售行為由5×8小時(shí)變成7×24小時(shí)后,數(shù)據(jù)基礎(chǔ)設(shè)施層面的任何一點(diǎn)疏忽大意或不能被預(yù)測(cè)的故障對(duì)于企業(yè)的生存和發(fā)展都可能造成滅頂之災(zāi)。這也是為什么最近幾年AIOps突然在數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)域爆紅的重要原因之一。
1不要再做“事后諸葛亮”
AIOps最早是由Gartner在2016年提出的概念,它旨在借助大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)算法自動(dòng)地從海量運(yùn)維數(shù)據(jù)中不斷分析和學(xué)習(xí),實(shí)現(xiàn)異常檢測(cè)、瓶頸熱點(diǎn)分析和多維關(guān)系分析等,從而幫助IT運(yùn)維人員準(zhǔn)確甄別系統(tǒng)異常、快速定位故障根因,并對(duì)系統(tǒng)運(yùn)行的潛在風(fēng)險(xiǎn)進(jìn)行主動(dòng)預(yù)測(cè),提前告警,最終實(shí)現(xiàn)IT基礎(chǔ)設(shè)施和業(yè)務(wù)的持續(xù)洞察和主動(dòng)優(yōu)化改進(jìn)。
隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的深入融合和綜合應(yīng)用,AIOps也開始快速向各個(gè)細(xì)分領(lǐng)域滲透,尤其是在數(shù)據(jù)基礎(chǔ)設(shè)施層面,智能運(yùn)維已經(jīng)成了各大存儲(chǔ)廠商新的必爭(zhēng)之地。現(xiàn)在回想起來,HPE當(dāng)初大手筆收購Nimble Storage是另有深意,落腳點(diǎn)是其基于云的智能運(yùn)維平臺(tái)InfoSight。如今,HPE正將InfoSight逐步引入到整個(gè)存儲(chǔ)和服務(wù)器產(chǎn)品線中,包括Primera、Nimble存儲(chǔ),以及ProLiant服務(wù)器、Synergy組合式基礎(chǔ)設(shè)施和Apollo系統(tǒng)等,而InfoSight也成了名副其實(shí)的“幕后英雄”,提供了基礎(chǔ)架構(gòu)層面的全局可見性、預(yù)測(cè)分析能力和推薦引擎等功能。
Gartner的研究顯示,2020年,AIOps在全球的采用率達(dá)到50%,AIOps成為運(yùn)維最主要的工具。IDC在最近發(fā)布的《IDC FutureScape: 全球人工智能(AI)市場(chǎng)2021 預(yù)測(cè)——中國(guó)啟示》報(bào)告中也做出了類似的預(yù)測(cè):到2024年,AIOps將成為IT運(yùn)營(yíng)的“新常態(tài)”,至少有50%的大型企業(yè)將采用自動(dòng)化運(yùn)維解決方案來自動(dòng)化其主要IT系統(tǒng)和服務(wù)管理過程。
從數(shù)字化轉(zhuǎn)型到智能化升級(jí),今天我們?cè)僬劦綗o人值守的數(shù)據(jù)中心、無人工廠或無人駕駛,大家不再認(rèn)為是天方夜譚,隨著智能化技術(shù)的持續(xù)演進(jìn),這一切將更快地變成現(xiàn)實(shí)。從宏觀市場(chǎng)的角度看,2020年,“新基建”的火爆讓我們更加清楚地認(rèn)識(shí)到,建設(shè)以“數(shù)據(jù)+智能”為核心的新型數(shù)據(jù)基礎(chǔ)設(shè)施刻不容緩,這是賦能千行百業(yè)智能升級(jí)、服務(wù)各種各樣智慧化的應(yīng)用場(chǎng)景,推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展的必然趨勢(shì)。從數(shù)據(jù)基礎(chǔ)設(shè)施穩(wěn)定高效運(yùn)行的微觀層面看,智能運(yùn)維有望徹底改變以前“事后諸葛亮”的狀況,發(fā)揮先知先覺的作用,主動(dòng)并提前預(yù)測(cè)數(shù)據(jù)基礎(chǔ)設(shè)施中潛在的風(fēng)險(xiǎn)和故障,從而更好地實(shí)現(xiàn)整個(gè)系統(tǒng)的自管理、自修復(fù)和自優(yōu)化,提高數(shù)據(jù)基礎(chǔ)設(shè)施的運(yùn)行效率,驅(qū)動(dòng)業(yè)務(wù)發(fā)展,降低成本。
2智能化,存儲(chǔ)發(fā)展的又一風(fēng)向標(biāo)
大數(shù)據(jù)是新的生產(chǎn)資料,而人工智能是新的生產(chǎn)力,這些新的生產(chǎn)要素組合在一起,將給各行各業(yè)帶來深刻變革甚至是顛覆。肆虐2020年的新冠疫情,就讓我們?cè)俅晤I(lǐng)略了由數(shù)據(jù)激發(fā)的洞察力,同時(shí)疫情也刺激了數(shù)據(jù)智能市場(chǎng)的跨越式前進(jìn)。
從行業(yè)用戶的具體需求來分析,數(shù)字化和智能化已成為金融企業(yè)致勝未來的關(guān)鍵要素。在智慧金融場(chǎng)景中,數(shù)據(jù)基礎(chǔ)設(shè)施必須保證即時(shí)、高效、穩(wěn)定,而服務(wù)則要在數(shù)據(jù)基礎(chǔ)設(shè)施之上實(shí)現(xiàn)敏捷發(fā)布、快速迭代,其最根本的保障在很大程度上就來源于數(shù)據(jù)基礎(chǔ)設(shè)施的智能運(yùn)維和自動(dòng)化。中信銀行就在完善和優(yōu)化其數(shù)據(jù)基礎(chǔ)設(shè)施的過程中,采用了華為DME數(shù)據(jù)管理引擎,在融合管理、業(yè)務(wù)變更以及統(tǒng)一運(yùn)維等場(chǎng)景引入了安全可控的自動(dòng)化和智能化能力,從而顯著提升了運(yùn)維效率和業(yè)務(wù)的敏捷水平,一舉多得。
再來看看電力行業(yè)的情況,電網(wǎng)公司在業(yè)務(wù)整合和數(shù)字化的過程中對(duì)存儲(chǔ)管理提出了更高的要求。由于歷史原因,系統(tǒng)中擁有多個(gè)品牌、多個(gè)系列的存儲(chǔ)設(shè)備,管理的復(fù)雜性和運(yùn)維風(fēng)險(xiǎn)持續(xù)走高。為進(jìn)一步完善數(shù)據(jù)存儲(chǔ)管理,提高效率,就必須采用集約式、規(guī)范化的存儲(chǔ)管理模式,充分實(shí)現(xiàn)存儲(chǔ)運(yùn)維管理的自動(dòng)化和智能化。
綜上,無論是從市場(chǎng)和技術(shù)的發(fā)展趨勢(shì),還是從行業(yè)客戶的實(shí)際需求來看,存儲(chǔ)與人工智能技術(shù)的深入融合勢(shì)在必行,將極大地降低存儲(chǔ)運(yùn)維的成本、復(fù)雜度和風(fēng)險(xiǎn)。當(dāng)前,存儲(chǔ)的智能化運(yùn)維正在形成一股新的潮流。一些以智能化見長(zhǎng)的存儲(chǔ)創(chuàng)業(yè)企業(yè)也如雨后春筍般不斷涌現(xiàn)。
我們也欣喜地看到,整個(gè)存儲(chǔ)業(yè)界對(duì)智能運(yùn)維的重視程度不斷提升。2020年12月,DOIT在一年一度的“百易獎(jiǎng)”評(píng)選中就特別設(shè)立了“2020年度人工智能技術(shù)創(chuàng)新獎(jiǎng)“,并授予了華為DME(Data Management Engine,數(shù)據(jù)管理引擎)數(shù)據(jù)管理與運(yùn)維自動(dòng)化解決方案。該解決方案創(chuàng)新性地引入三層AI架構(gòu),實(shí)現(xiàn)數(shù)據(jù)中心存儲(chǔ)網(wǎng)絡(luò)的自動(dòng)化資源發(fā)放、智能運(yùn)維以及智能數(shù)據(jù)流動(dòng),助力運(yùn)維極簡(jiǎn)以及業(yè)務(wù)敏捷創(chuàng)新。毋庸置疑,智能化將成為引領(lǐng)存儲(chǔ)未來發(fā)展的又一重要風(fēng)向標(biāo)。
3華為存儲(chǔ)引領(lǐng)AIOps創(chuàng)新
存儲(chǔ)行業(yè)是一個(gè)需要高研發(fā)投入和長(zhǎng)期積累的行業(yè),尤其是在一些核心技術(shù)的研發(fā)和相關(guān)能力的建設(shè)上更是如此,也由此建立了高門檻。華為是一家端到端IT基礎(chǔ)設(shè)施解決方案提供商,而智能運(yùn)維是IT基礎(chǔ)設(shè)施中一項(xiàng)不可或缺的能力,可想而知華為在這方面擁有多年的積累和成功實(shí)踐。隨著智能化在存儲(chǔ)中的地位進(jìn)一步凸顯,在Gartner定期發(fā)布的全球主存儲(chǔ)市場(chǎng)魔力象限中,居領(lǐng)導(dǎo)者地位的廠商一定也是在智能運(yùn)維方面擁有特長(zhǎng)的。而華為如今已是這一象限的?停谂c國(guó)際知名大廠商的博弈中,并不落下風(fēng)。
受到業(yè)界充分肯定的華為DME是華為數(shù)據(jù)基礎(chǔ)設(shè)施智能運(yùn)維平臺(tái),該平臺(tái)通過與存儲(chǔ)設(shè)備內(nèi)置的設(shè)備AI以及云端AI(eService)實(shí)現(xiàn)三層AI協(xié)同,并通過融合統(tǒng)一的管理界面、自動(dòng)化的閉環(huán)機(jī)制以及開放的API,旨在使能數(shù)據(jù)存儲(chǔ)的從規(guī)劃到建設(shè)、運(yùn)維、優(yōu)化的全生命周期場(chǎng)景管理與運(yùn)維自動(dòng)化,從而幫助客戶簡(jiǎn)化存儲(chǔ)管理,提升數(shù)據(jù)中心的運(yùn)營(yíng)效率。
華為存儲(chǔ)基于存儲(chǔ)AI“四大范式”,持續(xù)引領(lǐng)業(yè)界AIOps創(chuàng)新。
范式一,Workload指紋,業(yè)務(wù)識(shí)別的準(zhǔn)確率高于80%,可將資源使用效率提升30%,主要應(yīng)用于數(shù)據(jù)安置、數(shù)據(jù)流動(dòng)、硬件擴(kuò)容、業(yè)務(wù)擴(kuò)容等場(chǎng)景。舉例來說,可以實(shí)現(xiàn)基于策略的SLA變更功能,讓關(guān)鍵業(yè)務(wù)始終可以獲得更好的存儲(chǔ)資源保障,確保業(yè)務(wù)穩(wěn)定運(yùn)行。
范式二,知識(shí)圖譜,分鐘級(jí)快速定位到可恢復(fù)單元,主要應(yīng)用于全棧拓?fù)淇梢暬、VM到存儲(chǔ)E2E分析、告警關(guān)聯(lián)/根因分析、擾鄰分析等場(chǎng)景。舉例來說,可以實(shí)現(xiàn)告警關(guān)聯(lián)分析、一鍵式影響范圍評(píng)估,從而提升問題分析效率;實(shí)現(xiàn)性能異常預(yù)測(cè),KPI關(guān)聯(lián)分析以及修復(fù)方案推薦,2019年在某交通集團(tuán)有限公司,eService檢測(cè)到華為OceanStor 5500 V5存儲(chǔ)峰值寫時(shí)延達(dá)到190.66ms后,建議開啟SmartTier功能,使得時(shí)延恢復(fù)正常。
范式三,介質(zhì)故障預(yù)測(cè),可提前14天預(yù)知故障,故障識(shí)別率高于80%,誤報(bào)率則低于0.1%,主要應(yīng)用于整盤故障、盤局部故障、內(nèi)存失效、光模塊故障等場(chǎng)景。舉例來說,可以實(shí)現(xiàn)HDD、SSD故障盤預(yù)測(cè),通過選取故障時(shí)刻前14天的數(shù)據(jù)作為故障樣本,分析數(shù)據(jù)分布、增長(zhǎng)趨勢(shì)、特征相關(guān)性和重要度,進(jìn)行大樣本學(xué)習(xí)方法并在11萬塊盤上訓(xùn)練和測(cè)試,效果顯著優(yōu)于隨機(jī)抽樣選擇訓(xùn)練集方法,2018年6月華為數(shù)據(jù)中心就曾在一個(gè)月內(nèi)預(yù)測(cè)出3塊故障硬盤;使用AI算法進(jìn)行內(nèi)存故障模式識(shí)別和內(nèi)存故障預(yù)測(cè),并結(jié)合內(nèi)存Bank隔離等措施,實(shí)現(xiàn)內(nèi)存局部故障自修復(fù)和內(nèi)存故障預(yù)告警,減少內(nèi)存故障引起的系統(tǒng)宕機(jī)。
范式四,性能容量預(yù)測(cè),性能預(yù)測(cè)準(zhǔn)確率高于85%,主要應(yīng)用于性能瓶頸預(yù)測(cè)、容量瓶頸預(yù)測(cè)、KPI異常分析、網(wǎng)絡(luò)亞健康分析等場(chǎng)景。舉例來就,針對(duì)存儲(chǔ)資源(前端端口、控制器、Cache、存儲(chǔ)池、LUN和磁盤)的性能異常進(jìn)行實(shí)時(shí)監(jiān)控,提前獲知性能指標(biāo)(IOPS、時(shí)延和IO帶寬)的變化趨勢(shì),幫助客戶提前規(guī)劃,降低性能事故率;實(shí)現(xiàn)容量趨勢(shì)預(yù)測(cè),采用集成學(xué)習(xí)技術(shù),將多種基于時(shí)間序列的預(yù)測(cè)算法加權(quán)集成,充分捕捉多種時(shí)間序列特征,實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè);利用CNN神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)業(yè)務(wù)未來的性能趨勢(shì),該模型使用華為全網(wǎng)的LUN在過去3個(gè)月內(nèi)的性能數(shù)據(jù)大規(guī)模訓(xùn)練完成;性能潮汐分析,將規(guī)律以熱力圖方式進(jìn)行呈現(xiàn),某市區(qū)政府就根據(jù)潮汐熱力圖主動(dòng)選擇最合適的升級(jí)時(shí)間窗口,避免了業(yè)務(wù)高峰期操作可能對(duì)業(yè)務(wù)造成的不良影響。
上述諸多例證表明,人工智能技術(shù)的應(yīng)用,在優(yōu)化存儲(chǔ)基礎(chǔ)設(shè)施、存儲(chǔ)資源配置、性能優(yōu)化,以及提升自動(dòng)化和智能化水平方面功不可沒。當(dāng)前,對(duì)于存儲(chǔ)智能化的探索正漸入佳境,打造智能數(shù)據(jù)基礎(chǔ)設(shè)施將是企業(yè)智能化升級(jí)的必由之路。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 大模型“新星”開啟變現(xiàn)競(jìng)速
- 6 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 7 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 8 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 9 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 10 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市