中亦安圖 :圖技術(shù)在智能運(yùn)維行業(yè)中的實(shí)踐
以悅數(shù)圖數(shù)據(jù)庫為底座的智能運(yùn)維解決方案
隨著 IT 基礎(chǔ)架構(gòu)的標(biāo)準(zhǔn)化和自動(dòng)化水平的提升,,智能運(yùn)維技術(shù)開始在越來越多企業(yè)落地。但相較于互聯(lián)網(wǎng)企業(yè),,非互聯(lián)網(wǎng)行業(yè)的智能運(yùn)維還處于初級(jí)階段,,特別是金融行業(yè),,由于系統(tǒng)組件關(guān)系,、運(yùn)維對(duì)象,、運(yùn)維部門組織架構(gòu)等比較復(fù)雜,,而且監(jiān)管要求高,,運(yùn)維人員更新與引進(jìn)速度慢等綜合因素,,導(dǎo)致智能運(yùn)維在金融業(yè)的落地門檻較高。
目前,專門針對(duì)運(yùn)維場(chǎng)景設(shè)計(jì)與優(yōu)化的機(jī)器學(xué)習(xí)算法已經(jīng)逐漸成熟,,智能運(yùn)維落地的核心難點(diǎn)落在了如何對(duì)海量,、多維、多模態(tài)的運(yùn)維數(shù)據(jù)進(jìn)行持續(xù)的數(shù)據(jù)治理與高效的數(shù)據(jù)分析,。因此,,能處理多維數(shù)據(jù)統(tǒng)一查詢視圖的運(yùn)維數(shù)據(jù)基座成為眾多客戶與團(tuán)隊(duì)的真實(shí)痛點(diǎn)需求。
在考慮多維運(yùn)維數(shù)據(jù)的關(guān)聯(lián)需求或嘗試描述 IT 基礎(chǔ)架構(gòu)時(shí),,我們發(fā)現(xiàn)圖是最符合業(yè)務(wù)直覺的表達(dá)方式,。假想一下,故障發(fā)生時(shí)工程師腦海中最先浮現(xiàn)什么,?就是負(fù)責(zé)系統(tǒng)的整體架構(gòu)圖與組件依賴關(guān)系,,再結(jié)合自身的運(yùn)維知識(shí)進(jìn)行故障根因定位。
因此,,為了支持能夠靈活,、快速地形成多維數(shù)據(jù)的查詢視圖,我們選擇了 悅數(shù)圖數(shù)據(jù)庫 的圖數(shù)據(jù)庫作為更具優(yōu)勢(shì)的存儲(chǔ)與計(jì)算核心,。通過設(shè)計(jì)合理的圖譜結(jié)構(gòu),,組織起已經(jīng)自動(dòng)采集的 CMDB 數(shù)據(jù)、性能監(jiān)控指標(biāo),、應(yīng)用日志數(shù)據(jù),,甚至是基于微服務(wù)的 Trace 數(shù)據(jù),從而構(gòu)建出真正能滿足智能運(yùn)維的數(shù)據(jù)基座,。
我們知道,,變更是引起故障的重要原因之一。每次變更開始時(shí),,管理員都需要考慮變更對(duì)象,、影響面、觸發(fā)故障的隱患等一系列問題,。部分問題可通過持續(xù)集成的管理去解決,,另一部分問題則可通過對(duì)運(yùn)維圖譜進(jìn)行圖查詢解決。 在故障場(chǎng)景中,,也可以使用圖查詢的場(chǎng)景,如多告警實(shí)體關(guān)聯(lián)查詢,,我們可通過結(jié)果視圖尋找多個(gè) IP 之間的關(guān)系,,故障的根因就能浮出水面。
同時(shí),,使用圖算法能夠幫助企業(yè)進(jìn)行運(yùn)維數(shù)據(jù)分析和知識(shí)挖掘,,從而釋放企業(yè)長時(shí)間積累的運(yùn)維數(shù)據(jù)的真實(shí)價(jià)值。常用的圖算法包括:廣度優(yōu)先算法,、深度優(yōu)先算法,、所有節(jié)點(diǎn)對(duì)最短路徑,、最小生成樹算法、隨機(jī)游走算法,、中心性算法,、緊密性中心性、社群發(fā)現(xiàn)算法等,。
以 KGOPS 解決方案為例,,它采用 悅數(shù)圖數(shù)據(jù)庫 作為圖數(shù)據(jù)存儲(chǔ)核心,通過結(jié)合動(dòng)靜數(shù)據(jù),,KGOPS 提供標(biāo)準(zhǔn)的 Schema 定義方案,,用戶可以根據(jù)自身 IT 環(huán)境的具體情況,實(shí)際需求進(jìn)行定制化修改,。同時(shí),,我們?cè)?Server 層封裝了大量圖計(jì)算、圖分析的模塊,,可以組合提供用戶進(jìn)行使用,,并在用戶層提供統(tǒng)一的工作臺(tái),用戶可以方便地進(jìn)行交互查詢,。
目前圖相關(guān)技術(shù)已成為業(yè)界數(shù)據(jù)分析的熱點(diǎn)和重點(diǎn),,諸多頭部企業(yè)已經(jīng)擁有多年將圖應(yīng)用于運(yùn)維業(yè)務(wù)的經(jīng)驗(yàn),我們的智能運(yùn)維解決方案依托于圖數(shù)據(jù)庫 悅數(shù)圖數(shù)據(jù)庫 本身的圖計(jì)算能力與諸多頭部金融客戶的落地建設(shè)經(jīng)驗(yàn),,提供開箱即用的圖算法,,幫助客戶在具體的場(chǎng)景中實(shí)現(xiàn)智能算法,輔助疏通運(yùn)維管理的阻滯點(diǎn),,提升運(yùn)維團(tuán)隊(duì)整體效率,。
不同的應(yīng)用之間基于業(yè)務(wù)邏輯,呈現(xiàn)出各類應(yīng)用的數(shù)據(jù)訪問關(guān)系,,這些關(guān)系對(duì)應(yīng)用的運(yùn)行,、重要性等都有重要的參考價(jià)值。配置管理數(shù)據(jù)庫( CMDB )能夠?qū)?shù)據(jù)流向關(guān)系與應(yīng)用訪問關(guān)系以可視化方式呈現(xiàn)出來,,便于管理人員進(jìn)行數(shù)據(jù)分析,。
涉及技術(shù):路徑檢索類算法、圖譜自動(dòng)布局算法,、圖譜交互可視化引擎,。
價(jià)值:可用于性能分析、故障分析,、影響分析,,為管理者提供應(yīng)用性能監(jiān)控、數(shù)據(jù)鏈路支持。
基于應(yīng)用系統(tǒng)的整體架構(gòu)配置基線比對(duì),。包括對(duì)應(yīng)用,、中間件、數(shù)據(jù)庫,、服務(wù)器等進(jìn)行配置比對(duì),。
價(jià)值:直觀展示配置和架構(gòu)上的差異,為災(zāi)備切換,、應(yīng)用發(fā)布等復(fù)雜場(chǎng)景提供可行性分析的數(shù)據(jù)支撐,。
應(yīng)用系統(tǒng)的運(yùn)行架構(gòu)中,可自動(dòng)發(fā)現(xiàn)單點(diǎn)運(yùn)行的環(huán)節(jié),。
涉及技術(shù):圖視圖切換,、自定義圖查詢
價(jià)值:快速識(shí)別影響應(yīng)用系統(tǒng)可用性的風(fēng)險(xiǎn)點(diǎn)
利用應(yīng)用的類型信息、關(guān)系信息,,分析應(yīng)用的重要程度與影響范圍,,確定應(yīng)用重要級(jí)別。
涉及技術(shù):自定義圖查詢,、節(jié)點(diǎn)影響力算法
價(jià)值:對(duì)應(yīng)用系統(tǒng)的定級(jí)提供數(shù)據(jù)支持,,便于管理者對(duì)應(yīng)用系統(tǒng)進(jìn)行更加精細(xì)化管理
在項(xiàng)目初期,,該大型股份制銀行面臨的問題有:部分?jǐn)?shù)據(jù)關(guān)聯(lián)缺失/過多關(guān)聯(lián)直接無法顯示/無場(chǎng)景應(yīng)用指導(dǎo) / 多數(shù)偏向于自主查詢,。
中亦的團(tuán)隊(duì)通過融合該銀行的 CMDB 與其他可獲得的監(jiān)控性能數(shù)據(jù),配置變更數(shù)據(jù),、告警數(shù)據(jù),,采用科學(xué)合理的圖譜設(shè)計(jì)方法,構(gòu)建出統(tǒng)一,、全面,、可擴(kuò)展性強(qiáng),符合該銀行自身業(yè)務(wù)特點(diǎn)的運(yùn)維知識(shí)圖譜,。
構(gòu)建并完善了全景應(yīng)用運(yùn)維圖譜,,不僅可以支持更復(fù)雜的運(yùn)維管理場(chǎng)景變更影響面分析,,并可以對(duì)外提供數(shù)據(jù)查詢服務(wù),大幅降低運(yùn)維管理及外圍系統(tǒng)查詢對(duì)接成本,。
將告警粒度從應(yīng)用監(jiān)控指標(biāo)層穿透到資源指標(biāo)層,,明顯提升了故障定位的精度。
將小時(shí)級(jí)排障縮短至分鐘級(jí)排障,,大幅提升了故障定位的時(shí)效性,。
智能化運(yùn)維對(duì)于不同的角色帶來的收益是不同的。
對(duì)于管理層,,智能化運(yùn)維可實(shí)現(xiàn)資產(chǎn)數(shù)據(jù)化和可視化,,實(shí)現(xiàn)管理數(shù)字化,同時(shí)提升企業(yè)信息安全,。
對(duì)于運(yùn)維部門,,智能化運(yùn)維可實(shí)現(xiàn)企業(yè)動(dòng)態(tài)應(yīng)用拓?fù)鋱D、智能基線比對(duì),、智能變更審核,,同時(shí)支持基于 AIOps(人工智能 IT 運(yùn)營) 的各種提升。
對(duì)于業(yè)務(wù)團(tuán)隊(duì),,智能化運(yùn)維可實(shí)現(xiàn)部門資產(chǎn)可視化,、成本數(shù)字化、運(yùn)維數(shù)據(jù)采集加業(yè)務(wù)數(shù)據(jù),,實(shí)現(xiàn)全面提升運(yùn)營,、營銷和反欺詐效果。
目前,,智能運(yùn)維解決方案已在金融行業(yè)進(jìn)入落地階段,。歡迎相關(guān)行業(yè)伙伴前來交流,我們也希望為企業(yè)數(shù)據(jù)中心運(yùn)維數(shù)字化轉(zhuǎn)型提供更多支持,。
公司介紹
中亦科技是國內(nèi)領(lǐng)先的IT架構(gòu)“服務(wù)+產(chǎn)品”綜合提供商,,致力于為客戶提供IT基礎(chǔ)架構(gòu)層從架構(gòu)搭建,、運(yùn)行維護(hù)到自動(dòng)化、智能化運(yùn)維的全流程服務(wù),,同時(shí)為客戶提供基于IT應(yīng)用架構(gòu)層的運(yùn)營數(shù)據(jù)分析服務(wù),。