1 IT服務管理實施現(xiàn)狀
為了更好地滿足客戶需求,進一步提升IT服務水平、IT工作效率、IT運營穩(wěn)定性,中國電信集團公司(以下簡稱中國電信)從2008年底開始,以ITIL V3 (ITinfrastructure library , IT基礎架構標準庫,IT業(yè)界的服務管理標準庫,是一套IT組織用來計劃、研發(fā)、實施、運維高質量IT服務的標準方法,已發(fā)展成為IT服務管理(ITservice management , ITSM)領域的事實標準)為參考,根據(jù)企業(yè)發(fā)展戰(zhàn)略對IT的要求,結合企業(yè)實際情況和未來需求,從組織與人員、制度與流程和技術手段3方面設計了完整的IT服務管理體系架構(如圖1所示)和實施計劃。
圖1 IT服務管理體系架構
中國電信IT服務管理的體系架構包括組織與人員、流程與制度和技術手段3方面內容。
·組織及人員方面:建立統(tǒng)一的IT服務臺組織,明確IT服務臺為企業(yè)內部客戶與IT部門的唯一接觸點;同時定義了服務臺的職能、IT服務管理各流程涉及的各種角色及其職責,以及流程角色與現(xiàn)有崗位的映射對應關系。
·制度流程方面:流程設計參考了ITIL V3,按照服務生命周期的主線設計了戰(zhàn)略規(guī)劃、服務設計、服務交付和服務運維流程,并根據(jù)企業(yè)的實際情況對服務設計域的需求管理流程,服務交付域的變更管理、資產與配置管理、發(fā)布與部署管理、知識管理流程,服務運維域的事件管理、接人管理、服務請求管理、問題管理和日常運維管理流程進行了詳細的設計。
技術手段方面:建立一體化平臺,對IT服務管理流程進行固化,對關鍵點進行管控,建立統(tǒng)一的配置管理數(shù)據(jù)庫(configuration management database,CMDB),并實現(xiàn)對IT基礎設施、應用和端到端服務流程的監(jiān)控,以提升主動預警和規(guī)范化的運作能力。
經過近3年的體系化實施,中國電信的IT服務管理已取得了初步成效:各省建立了統(tǒng)一的仃服務臺,統(tǒng)一了服務熱線和用戶接觸,規(guī)范了事件和問題的處理,提高了效率及用戶滿意度;實現(xiàn)了需求的集中管理,減少了無效需求,提高了需求質量,實現(xiàn)了需求的有序開發(fā);實現(xiàn)了變更、測試、發(fā)布流程的固化,減少了非審批變更,提高了版本穩(wěn)定性和服務穩(wěn)定性;固化了作業(yè)計劃,并提示式執(zhí)行,提高了維護工作質量;實現(xiàn)了主動式的運營監(jiān)控,及時發(fā)現(xiàn)系統(tǒng)異常,減少了系統(tǒng)故障的發(fā)生數(shù)量,提升了主動預防式能力和快速恢復能力,進一步提升了服務水平和客戶滿意度。
2 資源池管理對IT服務管理帶來的挑戰(zhàn)
隨著云計算的快速發(fā)展,中國電信也加快了云計算的研究和應用。中國電信已經對外正式發(fā)布了“天翼云計算”戰(zhàn)略。明確對于企業(yè)內部IT私有云,將采用云計算技術整合內部IT系統(tǒng)的IT基礎設施和應用架構,建設內部PC服務器資源池和Unix資源池(如圖2所示),并逐步完成可遷移應用如CRM(客戶關系管理系統(tǒng))的Web ,APP層向PC資源池的遷移,提高基礎設施共享水平及應用系統(tǒng)彈性,降低IT總體擁有成本。
圖2 資源池示意
資源池的建設給管理和運營帶來了新的變化。資源池的主要特征是虛擬化十管理自動化,通過虛擬化技術將主機等資源拆分成多個相互獨立的虛擬機,并進行自動化調度,從而提高資源使用的精細化程度及利用效率;同時基于統(tǒng)一的流程,根據(jù)需求,申請快速提供和回收資源,從而提高業(yè)務響應效率。資源池的高效管理要求能夠對物理資源、虛擬資源實現(xiàn)統(tǒng)一部署調度,并可在運行時根據(jù)資源的使用情況和應用要求動態(tài)伸縮或遷移等。所有的這些變化對現(xiàn)有IT服務管理體系提出了新的要求和挑戰(zhàn),ITSM的實施無疑將變得更為復雜。具體表現(xiàn)在以下幾個方面。
(1)管理體系方面
資源池運營模式下,資源分配和使用發(fā)生了變化,不再像傳統(tǒng)方式那樣按單個系統(tǒng)部署硬件、獨享式使用,而是要求IT基礎設施資源統(tǒng)一規(guī)劃和建設、基礎能力提前具備、全專業(yè)共享。
(2)流程設計及支撐方面
用戶要能通過服務目錄進行自助式資源申請、創(chuàng)建、修改、回收,并能通過系統(tǒng)進行固化。
(3)技術手段方面
主要體現(xiàn)在資源的部署和監(jiān)控管理兩方面。
·資源的快速部署和按需動態(tài)伸縮:支持通過模板進行資源的快速部署就緒,支持應用及虛擬機動態(tài)遷移,可根據(jù)需要在應用繁忙時動態(tài)增加計算資源、空閑時釋放計算資源,并可進行資源池內的虛擬機動態(tài)遷移,高效穩(wěn)定運行并充分利用計算資源。
·監(jiān)控管理:對異構平臺的虛擬機進行管理,包括其性能和容量管理等都更為復雜。傳統(tǒng)的監(jiān)控、管理和優(yōu)化軟件已不能滿足管理需求。同時,能夠監(jiān)控用戶對資源的訪問,包括用戶身份、所訪問的資源和數(shù)量以及對容量和可用性管理的有效控制。
綜合以上幾個方面,可以看出在這種資源池運行環(huán)境下,管理模式、流程支撐、資源調度以及監(jiān)控方面等要求將使ITSM變得更為復雜。如何將現(xiàn)有的資源池管理要求納人現(xiàn)有的IT服務管理體系,進一步提升資源池環(huán)境下的IT服務質量,加快服務交付,是IT服務管理體系優(yōu)化需要急迫解決的重大問題。要解決這個問題首先就要分析對資源池管理的關鍵能力要求,這樣才可以全面對現(xiàn)有的IT服務管理體系進行針對性的調整和優(yōu)化。
3 資源池管理的關鍵能力要求
資源池管理帶來的挑戰(zhàn),需要在自助服務、申請及開通、資源池管理、操作與運維、計量統(tǒng)計等主要方面具備以下能力要求,如圖3所示。
圖3 資源池管理的關鍵能力分析
·便捷的用戶自助服務能力:基于不同角色(如用戶、管理員)提供個性化的自助服務門戶功能,方便用戶提供資源申請及進度查詢、所擁有資源利用情況統(tǒng)計,為管理員提供虛擬機開通與回收、資源池使用情況統(tǒng)計查詢等。
·清晰的服務目錄和流程配置能力:能夠基于資源池提供服務目錄,如不同配置的裸虛擬機、不同操作系統(tǒng)的通用虛擬機、安裝不同版本系統(tǒng)軟件的專用虛擬機等,并實現(xiàn)相應服務的流程支撐。
快速部署和靈活動態(tài)伸縮的資源管理能力:可管理資源池所有管理對象(如虛擬數(shù)據(jù)中心、集群、宿主機、虛擬機、虛擬存儲、虛擬網絡等)及對象之間的關系,并能提供細粒度的系統(tǒng)、網絡、存儲的資源分配及調整能力(如CPU、存儲空間、I/0帶寬等);可根據(jù)預定模板及配置自動生成和開通虛擬機資源(含批量),支持靈活的資源分配和調度策略,并能夠根據(jù)資源池運行性能及預定策略進行靈活的資源伸縮或動態(tài)遷移。
主動性的運維支持能力:可提供資源池、物理機(宿主機)和虛擬機等不同粒度的性能和可用性監(jiān)控,并能主動及時預警;可根據(jù)資源使用情況、增長情況等容量統(tǒng)計數(shù)據(jù),實現(xiàn)資源池可滿足業(yè)務的周期預測及需求預測,支持容量規(guī)劃(如經過分析,當前資源池還可支持3個月的業(yè)務增長;若要滿足未來1年需求,則需擴容資源池內物理機CPU總個數(shù)到1 000個、存儲容量擴展到500 TB等)。
準確的計量統(tǒng)計能力:可根據(jù)資源使用情況,提供容量使用報告數(shù)據(jù),為業(yè)務部門提供準確的成本核算依據(jù),以實現(xiàn)資源合理、高效分配和使用。
4 資源池環(huán)境下的IT服務管理實施策略
4.1實施策略
根據(jù)上面的資源池管理的能力要求分析,需要對IT服務管理體系架構的制度與流程設計、人員崗位和技術手段3個方面進行調整和優(yōu)化,才能保障資源池的穩(wěn)定運營。
(1)流程設計方面
建立資源申請、開通、擴容、回收等所需的流程,提高資源申請使用的規(guī)范性和便捷性。為了避免流程種類越來越多,可以將此資源類流程納人原來的需求管理流程 范疇,通過增加需求分類標識和對應的資源需求模板來實現(xiàn),并固化到原來的IT服務管理系統(tǒng)中;在管理制度上要制定資源池的統(tǒng)一規(guī)劃建設制度。
(2)人員崗位方面
設置資源分配及優(yōu)化的崗位,優(yōu)化資源池利用效率:在現(xiàn)有基礎設施統(tǒng)一監(jiān)控崗位的基礎上,設立專門的資源分配及調度崗位,負責資源池的統(tǒng)一管理、開通以及各 種物理機/虛擬機模板的管理;設立專門的性能優(yōu)化崗位,定期分析各虛擬機資源利用率,必要時進行縱向擴展及回收(CPU、內存、磁盤空間等)。
(3)技術手段方面
增強IT服務管理系統(tǒng)能力,實現(xiàn)虛擬化資源的統(tǒng)一管理,其主要功能要求如圖4所示。
圖4 IT服務管理系統(tǒng)功能架構
服務管理域:通過服務目錄,為IT用戶提供自助的虛擬機等資源申請、修改、回收、查詢等服務,并通過規(guī)范化需求管理、變更管理等流程的支撐,支持資源申請 的開通及回收,實現(xiàn)對資源服務全生命周期的管理。這部分還包括配置數(shù)據(jù)管理(CMDB)功能,增加資源池相關的物理機、虛擬機、網絡、存儲等配置項的關系 管理及拓撲管理功能。服務管理域功能主要是增強原IT服務管理系統(tǒng)中的流程支撐和CMDB的管理能力來實現(xiàn)。
監(jiān)視管理域:通過對資源池范圍內的各類對象(虛擬數(shù)據(jù)中心、集群、宿主機、虛擬機、虛擬存儲和虛擬網絡)的性能數(shù)據(jù)管理、運行狀態(tài)監(jiān)視、容量監(jiān)視、健康分 析和告警管理,及時發(fā)現(xiàn)異常和潛在問題,并支持基于容量數(shù)據(jù)對資源池、數(shù)據(jù)中心、集群、宿主機等容量發(fā)展趨勢做出預測。監(jiān)視管理域的功能主要是通過增強原 規(guī)范中的IT基礎監(jiān)控系統(tǒng)的能力來實現(xiàn)。
資源調度域:支持資源(宿主機、虛擬機等)的自動發(fā)現(xiàn)及納管,支持多種格式模板的配置及管理;支持多種調度策略管理,如高可用、負載均衡等策略;支持資源 創(chuàng)建、修改、遷移、克隆、回收的全生命周期管理;根據(jù)資源性能指標及預置調度策略,實現(xiàn)資源池運行時的自動伸縮及遷移調度。資源調度域的能力主要是在原 IT基礎設施監(jiān)控系統(tǒng)中增強操作控制管理能力來實現(xiàn)。采集與控制域:本層屏蔽異構的各種主流虛擬化技術平臺(如VMware,Hyper- V,KVM,Redhat Xen/KVM)的差異性,通過主動采集等方式,獲取不同管理對象(宿主機、虛擬機等)的配置信息、性能信息、告警信息,并負責管理對不同被管對象發(fā)起調 度控制時的命令傳遞和結果反饋;并把操作結果和各類信息以統(tǒng)一的接口對上提供。采集與控制域的能力主要是通過增強原IT基礎設施監(jiān)控系統(tǒng)的采集與控制功能 來實現(xiàn)。
4.2接口策略選擇
實現(xiàn)系統(tǒng)能力重要的基礎就是如何實現(xiàn)與虛擬化平臺的接口互聯(lián),通過互聯(lián)接口進行監(jiān)視信息的獲取和資源的調度管理。主要有以下兩種模式。
模式I:與虛擬化廠商Hypervisor提供的接口進行互聯(lián),實現(xiàn)相關信息(如性能信息、配置信息、告警信息)的獲取以及操作控制,如圖5所示。
圖5 接口模式
模式2:與虛擬化廠商管理軟件提供的接口進行互聯(lián),實現(xiàn)相關信息(如性能信息、配置信息、告警信息)的獲取以及操作控制,如圖6所示。
圖6 接口模式2
從目前的情況來看,模式I的Hypervisor層提供的接口很底層,其接口開放程度不如模式2;模式1的Hypervisor層提供的接口的穩(wěn)定性也不如模式2,其變更對上層系統(tǒng)的穩(wěn)定性帶來的風險可能比模式2要大,所以建議優(yōu)先考慮模式2的接口方式。
5 結束語
資源池環(huán)境下的IT服務管理的調整和優(yōu)化,首先要改變原來的以硬件獨享式的項目立項、建設和使用的管理模式,實現(xiàn)IT基礎設施的統(tǒng)一規(guī)劃、建設和共享式使 用;同時制定資源池的資源申請、修改和回收流程,并設置資源池管理崗位,負責資源池的規(guī)劃、建設、監(jiān)控和優(yōu)化;同時要加強系統(tǒng)能力的建設,具備物理資源、 虛擬資源統(tǒng)一的監(jiān)控、資源部署與調度、事件處理的能力。只有在組織、流程和技術手段3方面齊頭并進,才能有效實施資源池環(huán)境的IT服務管理,持續(xù)提升IT 服務管理質量。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.lukmueng.com/