微軟運作框架(Microsoft Operation ramework,簡稱MOF)是微軟公司以ITIL為基礎,聯合業界專家、合作伙伴等開發的IT運營管理方法。MOF主要是為更好地運營微軟公司的產品和服務而開發的,但它對于非微軟公司的IT產品和服務的運營管理同樣有積極的指導作用。
筆者所在單位針對現有的基于微軟產品及解決方案的基礎平臺IT環境,基于MOF的微軟最佳實踐及方法論、結合業界標準規范,在對基礎平臺建設與運維現狀評估基礎上設計了基于MOF的運維管理體系,并作了初步的實踐和探討。
1.MOF概述
1.1 基本介紹
MOF是Microsoft Operations Framework 的簡稱,是一個流程最佳實踐集合,用戶可以根據它來設計有效操作IT基礎結構所需的步驟、控件和角色。MOF基于信息技術基礎架構庫(ITIL),它增強了Microsoft平臺的針對性,最新版本是v4.0于2008年4月發行。
MOF提供有關如何規劃、部署和維護IT操作過程以支持關鍵任務性服務解決方案的指南。并提出了一套完整的模型,包括過程模型、團隊模型、風險模型等。MOF作為通用模型,在將其用于具體行業時還必須修改許多建議。
1.2 過程模型
MOF提出的過程模型所討論的IT服務周期包含三個階段和一個基礎層,具體是:
Plan規劃階段:遵循業務戰略,規劃及優化IT服務;
Delivery提交階段:設計及部署IT服務;
Operate操作階段:持續提供服務運維及支持;
Manage管理基礎層:進行運維管理、規章、制度的制定及推行,最佳實踐設定,確保 IT 投入在可控的風險范圍內實現期望的商業價值。管理基礎層Manage Layer 的目標是建立一個整合的IT服務管理的軟環境,以協調Plan、Delivery及Operate三大階段中的相應服務管理職能(Service Manage Function,簡稱SMF)高效運作。
1.3 MOF與ITIL的關系
ITIL是信息技術基礎架構庫(即Information Technology Infrastructure Library)的簡稱,由英國政府商務辦公廳(OGC)編纂的業界公認的信息系統運維的最佳實踐指導方針。涉及業務管理、服務管理、IT基礎構架管理、應用管理、安全管理、IT服務管理規劃與實施等IT運作管理的各個方面。Accenture、Avanade、Fox IT、惠普、朗訊科技/NetworkCare專業服務、微軟顧問咨詢服務(MCS)和微軟操作運轉與技術支持集團(OTG,原名信息技術集團[ITG])等知名公司多年積累的寶貴IT操作運行經驗均被ITIL所收錄。
MOF 是基于下列各項的結構化的靈活模型:
Microsoft咨詢和支持團隊及其與企業客戶和伙伴合作的經驗以及Microsoft內部IT操作組;
IT基礎架構庫(ITIL),它描述了提供關鍵任務性服務解決方案所需的過程和最佳實踐;
來自國際標準化組織(ISO)的ISO/IEC 15504,它提供了用以評估軟件過程成熟度的規范化方法。
MOF又有別于ITIL,在ITIL的基礎上,增加了多個服務管理職能,具體提供了有關部署各種Microsoft產品(如 Microsoft Windows Server、Microsoft Application Server、Microsoft System Center等)的操作指南和最佳實踐。
2.基于MOF的運維管理體系框架設計與實踐
2.1 運維管理體系基本框架
設計的基于MOF的運維管理體系主要是以MOF的“過程、團隊、風險”三大模型作為理論依據;通過清晰梳理日常IT運維服務管理過程中遇到的各類問題,以”人員、流程和技術”為三大核心因素,力求使IT運維過程變得有序連貫,建立包括組織、制度、流程、技術支撐、績效考核的IT 運維體系,以全面提高運維服務的質量和水平,保障系統高效、穩定、安全運行和對用戶應用的優質服務。
結合MOF服務管理功能SMF的要求,制定、完善相應的管理規章制度,規范操作流程;根據MOF團隊模型,對系統運維團隊角色做出更為明確的職責分工和定義所需技能要求;基于風險管理模型強化應急預案系統建設,一方面完善信息安全監督機制,另方面強化安全產品的及時升級及監控、維護,確保安全防范切實、有效,逐步建立、完善關鍵業務應急災備信息系統,用以在緊急情況下保障關鍵業務信息系統的正常運行。
2.2 運維管理支撐平臺架構
根據提出的運維管理體系框架來設計并搭建了本單位的運維管理支撐平臺,提供保障信息系統運行維護管理流程改進、整體高效運轉的技術手段,圍繞核心服務管理功能SMF模塊,選用模塊化設計。
運維管理支撐平臺以MOSS(Microsoft Office Sharepoint Server)門戶、System Center 中的系統監控和服務管理等模塊產品為基礎,結合統一用戶管理、多渠道通訊平臺、工作流和報表服務等公共應用平臺,根據運維體系階段性業務需求,逐步定制開發相應的業務功能模塊,最終以統一的運維門戶與運維團隊、最終用戶進行交互。
2.3 運維管理支撐平臺基礎服務組件
運維支撐平臺的基礎服務組件基于微軟成熟產品并結合基礎平臺進行構建。
MOSS門戶提供靈活的表單定制功能和強大的內容管理功能。配置管理數據庫基于門戶進行定制,不但可以實現配置數據的存儲而且可以實現配置信息之間的關聯。部分服務管理功能中的表單和過程可以通過門戶的列表和工作流定制完成。相關基礎服務組件如SCOM監控系統中產生的報表及視圖也可集成在MOSS門戶中統一展示。
利用System Center系統監控軟件SCOM,自動化完成網絡、軟、硬件管理和監控功能,監控數據可以通過門戶統一展現,同時集成多渠道通訊平臺,在特定事件發生時,及時通知運維人員。
利用SCOM系統提供的先進、實用、高效工具,運維管理人員可以實時監控各系統的運行狀態,包括對服務器、網絡、數據庫和應用系統的運行狀況進行實時監控,如服務器的CPU、內存和磁盤空間使用情況;網絡設備的接口利用率、數據流量和丟包率等;分布式應用系統業務視圖中各節點狀態的監控。當系統超過設定閾值自動報警時,通過系統間的關聯分析,運維管理人員可以主動發現并解決故障;并通過系統產生的報表進行趨勢分析,尋找潛在故障,防患于未然,有效支持了業務工作的順利開展。通過SCOM監控管理平臺的建立,用電子巡檢方式代替了人工巡檢,大大縮短巡檢周期,提高了工作效率。同時為性能指標設定不同級別的報警閾值,當性能超過閾值時,系統將自動詳細記錄報警信息,并自動通知相關運維管理人員,逐步改變了以往被動服務的局面,提高了系統無故障運行時間。
2.4 運維管理支撐平臺功能模塊
問題管理模塊將管理問題的描述、重現環境、解決方案、關聯的配置項等信息。對于IT系統的變更階段以及運行過程中發現的問題,需要通過問題管理模塊進行跟蹤、管理。相關運維管理人員可以通過問題管理模塊,對新提交的問題進行分析,尋找解決方案,并記錄入系統,同時,問題管理模塊還需要支持發現解決方案后,問題匯總并觸發變更請求(RFC),在下一個該IT系統版本中修復已知問題。
變更請求管理可以幫助用戶跟蹤與設計更改關聯的風險。團隊成員可以提交更改請求,并向項目負責人通知與更改有關的風險。通過該應用程序模板,團隊成員可以批準或拒絕請求。此外還有IT團隊工作區、知識管理、風險管理、考核評估以及文檔管理模塊。
3.結論
通過對基于MOF的IT運維管理體系和技術支撐平臺的實施,本單位在提升IT運維管理能力方面取得了初步成效。一方面,主動運維方式可以使設備和系統維護的效率及平均無故障時間得以提高,緩解了技術力量缺乏的問題;另一方面,規范化的IT運維服務管理使運維團隊中的各個角色與職責有了較清晰的定義,使維護責任和安全責任落到實處,在實現IT運維服務質量逐步提高的基礎上,也將使得IT運維服務的成本得到有效控制。當然,要使運維管理從傳統的單一、被動和低效的管理方式徹底轉變為統一、主動和高效的管理模式,全面提升運維管理水平,還有待于在工作中通過持續的實踐探索對運維管理體系進行不斷更新。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.lukmueng.com/
本文標題:基于MOF的IT運維管理實踐的路徑創新