智象智能運維系統在新能源行業的應用
背景
隨著信息時代的持續發展以及企業IT不斷建設,IT運維已經成為IT服務管理中重要的組成部分。面對越來越多復雜的業務、多樣化的用戶需求,不斷擴展的IT應用需要越來越合理的模式來保障IT服務能靈活便捷、安全穩定地持續保障,面對復雜的數據中心,單靠人工已無法滿足在技術、業務、管理等方面的需求,如何實現標準化、自動化、架構優化、過程優化等IT運維服務成為重要的研究課題。
建設目標
? 集中化管理
能解決新能源行業跨網閘問題,通過CMDB集中納管全網30+數據中心、300+新能源場站、10w+資源的配置管理,并建立資源管理的標準規范,實現實時掌握最新資源數據。
? 精益化監控
通過監控預警、運行分析、安全分析等,實現各資源運行的精益化管理,提升監控預警準確性,故障快速定位,運維安全化。
? 自動化運維
結合標準化資源、流程化服務,通過自動化工具實現巡檢自動化、合規自動化、部署自動化、配置自動化、監控分析自動化、資源分配自動化。
? 可視化呈現
采用數字孿生技術,完成運維數據的可視化,使管理人員能夠清楚自身所掌握的資源,對外部的用戶也實現了透明服務,更有效地對業務部門進行運維支撐。
? 標準化運維流程
以流程為導向、以業務為中心,通過服務級別協議(SLA)來保證IT 服務的質量,融合了請求、事件、發布、變更、問題、排班等許多流程的管理和實踐,改變原有紙質單據簽字或郵件審批模式,有效提高運維的質量、規范并降低成本。
解決方案
1、 部署架構
電力系統信息基礎架構的分區結構原則上可劃分為生產控制大區(控制Ⅰ區、非控制Ⅱ區)和關系信息大區(生產管理Ⅲ區、辦公管理系統Ⅳ區),大區之間使用專用隔離裝置進行物理隔離,小區之間使用防火墻進行安全隔離。通過對不同區域的獨立安全保護,使得電力系統的安全性大大提高。
基于此網絡架構,本次建設方案中系統部署架構如下:
考慮安全性,在跨安全區域傳輸數據時,采用數據轉換服務進行數據轉換,將實施數據轉為異步數據通過網閘進行傳輸,以滿足電力行業對安全性的要求。
2、 功能架構
構建公司“1+5+N”IT運營保障體系:1套管理平臺統一納管關鍵業務流程、應用系統、基礎軟硬件、運維服務,建立可觀測、可量化的預防、感知、定位、恢復、改進5大保障能力,基于數據獲取和自動化能力持續構建N個保障場景。
? 1套管理平臺:實現采集、監視、控制、告警、自動化一體管理平臺。
? 5大保障能力:從生產型模式走向運營型模式,從建設升級走向迭代演進,幫助運維團隊以數字化的方式構建運營核心競爭能力。
? N個業務場景:基于靈活監控基座,跟隨業務變化動態調整,覆蓋各類業務。
3、資源臺賬管理
一、解決方案:
1. 打造臺賬管理數據庫為整個運維平臺的支撐系統,將所有IT資源進行統一管理,強化數據共享能力。
2. 臺賬系統具備強大的擴展性、靈活性,可根據用戶未來的需求進行功能擴展;同時可靈活配置臺賬系統中的各項內容,如自定義配置項及屬性、關系、展示頁面等。
3. 臺賬系統具備自動化功能,支持自動發現網元、自動采集配置信息、自動生成拓撲、自動關聯虛擬機與宿主機間的關系等。
4. 臺賬系統可對傳統IDC資源與云平臺資源進行統一的管理。
5. 臺賬系統可對資源數據變更進行審核,確保數據的準確性與唯一性,同時具備安全審計管理,可對臺賬中的任意操作進行安全審計。
二、實現效果:
通過智能運維管理系統的資源管理模塊實現自定義資產模型、自定義屬性、以及支持設備資源的自動采集、補齊、校驗等操作,確保數據的準確性。統計人員預統計數據時,可通過模型中設置的單個或多個屬性進行組合查詢,可對查詢出的數據可查看具體信息及導出操作。
4、監控告警管理
一、解決方案:
監控架構拆分為四層價格:數據源、數據采集、應用功能、展示;
數據源:主要用于存儲臺賬對象對應的數據源,包括數據獲取方式、協議、執行代碼等;
數據采集:用于存儲臺賬對象與采集模型的匹配關系,包括關系、采集周期、保存時間、數據計算、數據展示等各項功能;
應用功能:該層級主要用于對臺賬對象的數據展示,頁面配置等;
展示層:用于集中展示,如大屏、3D等;
二、 實現效果:
5、 IT運營流程管理
一、解決方案:
1. 可快速實現自助服務臺、事件管理、問題管理、變更管理、發布管理、配置管理、SLA管理等ITIL核心流程;
2. 系統提供圖形化工作流程制作工具,用戶可根據需求靈活自定義和調整流程,無需二次開發;
3. 可幫助企業明確各運維管理流程的角色和職責,梳理業務過程,保證運維管理流程的快速交付;
4. 基于標準的流程、表單、報表、SLA等IT服務模型,可快速制定行業最佳實踐;
5. 提供靈活的自定義管理,支持流程自定義、表單自定義、權限自定義、報表自定義等;
6. 提供標準開放的API,可與臺賬管理、監控平臺、自動化平臺、消息通知平臺等系統進行對接,讓IT服務管理更加嚴謹而高效。
二、 實現效果:
6、 自動化作業管理
一、 解決方案
自動化平臺提供任務流程編排功能,可將周期性、重復性、規律性的運維工作實現運維過程流程化,也支持將復雜的作業節點編排成任務,同時支持主流程嵌套子流程,可與操作管理中的腳本配合使用,設定觸發條件和時間,即可執行相關腳本處理相關問題,可根據運維需求滿足更多靈活應用場景。
任務流程與自動化工具完整對接,用戶根據實際情況在流程中設計每個環節所輸入的字段,類型等,所有流程數據最終落地相關工具,實現流程數據可追溯、可落地。還可根據用戶在每個任務環節均可設置對應動作,實現對任務環節的數據自動處理,從而實現災備切換、版本部署、系統運維、自動巡檢等自動化功能以及自助化設計自動化任務。
二、 實現效果
方案價值
1. 成本
? 通過自動化方式實現數據的自動采集,規避人工維護,降低數據維護成本,降低因數據維護產生的人工成本;
? 告警分析,提高運維故障定位效率的同時,降低時間成本、人力成本;
? 通過流程實現對人員的工作管控,使工作可度量,可考核,發揮人員更高效的能力;
? 自動化系統,毫秒級響應,毫秒級處理,提供處理效率的同時降低時間成本;
? 自動化系統,規避人工帶來的人為風險,降低因人為導致的系統故障連帶的綜合成本;
2. 效率
? 通過構建臺賬管理模塊,通過自動采集實現運維統一數據管理,資產等進行統一管理,對外提供數據訂閱服務,從而實現高效的數據同步及發布服務,較傳統煙囪式數據維護方式效率提升數倍
? 統一監控實現環境、網絡、主機、應用、IOT等的全鏈路監控,通過監控數據分析,實現對業務系統性能瓶頸進行分析,通過數據反推系統進行優化,實現定點優化,提供業務系統優化效果
? 通過流程管控,實現流程與監控、流程與自動化、流程與數據的閉環銜接,提供數據流轉效率。
? 自動化平臺實現對網絡、OS、應用、業務的聯動處理,降低傳統運維多團隊配合耗時,提供負載任務處理效率
3. 管理
? 采用自動化數據采集,極大程度提高數據準確都,為后續運維管理提供數據基礎,實現運維精細化管理
? 系統自動流轉、自動跟催、自動督辦,提高對團隊作業效率,便于管理,流程驅動人工,以流程的方式推動人員變動,便于制度的執行及考核
? 全域監控,實現對業務端到端性能管理,以數據推動人員,促進團隊責任邊界,規避因推卸責任導致的成本浪費
? 自動化系統,替代人工完成任務,降低對人的依賴,促進人員管理