業(yè)務支撐系統(tǒng)是指由計算機硬件、存儲設備、網(wǎng)絡通訊設備、計算機軟件、信息資源和相關業(yè)務管理流程組成的以處理業(yè)務信息為目的的系統(tǒng)。業(yè)務支撐系統(tǒng)高可用是指系統(tǒng)應對風險具有自動調整和快速反應的能力,以保證業(yè)務的連續(xù)運轉。高可用保障體系由本地應急系統(tǒng)和容災系統(tǒng)組成,本地應急系統(tǒng)、容災系統(tǒng)與生產(chǎn)系統(tǒng)相互配合共同保證整體業(yè)務的連續(xù)性。
目前,傳統(tǒng)的應急容災方案通常基于本地設備高可用(如主備雙機、存儲柜間鏡像等)、異地數(shù)據(jù)容災復制等技術,這些方案存在以下不足:(1)本地災難時異地應用恢復時間(RTO)較長。當發(fā)生本地機樓級災難時,異地的容災主機需重新加載數(shù)據(jù),重新啟動,恢復時間估計為30~120分鐘,這樣會造成較大的損失;(2)異地容災設備資源的浪費,在平時正常情況下,異地主機不承擔或承擔少量生產(chǎn)業(yè)務,主機資源浪費嚴重;(3)應急容災切換和災難修復回切操作復雜,需制定完備的容災管理體系,并定時演練,以保障災難時操作的高效。
本文基于存儲虛擬化技術提出一種業(yè)務支撐系統(tǒng)容災保障的新思路,可解決傳統(tǒng)高可用保障方案的不足。本地和遠端同時承擔生產(chǎn)和容災的角色,實
現(xiàn)業(yè)務雙中心雙活模式,一端發(fā)生災難時,另一端可實時接管。該方案基于存儲同步復制技術的雙活業(yè)務支持應急系統(tǒng)應用,采用虛擬化存儲,實現(xiàn)兩個站點資源的同時使用,再配合使用文件集群系統(tǒng),生產(chǎn)端和容災端在平時都承載生產(chǎn)業(yè)務,分區(qū)域進行業(yè)務分擔。理論上可實現(xiàn)同一個數(shù)據(jù)庫/文件系統(tǒng)被多個主機同時訪問,在本地和異地兩個數(shù)據(jù)中心節(jié)點上均可同時啟動并對外提供服務。
1 業(yè)務支撐系統(tǒng)概述
1.1 系統(tǒng)設計的分層結構
按系統(tǒng)功能架構一般可分為IP網(wǎng)絡層、主機層、存儲網(wǎng)絡層和存儲層,各層的高可用設計如下:
IP網(wǎng)絡層:包括交換機、防火墻、路由器、負載均衡器等。通常采用主備雙平面設計,當主網(wǎng)絡平面某節(jié)點的網(wǎng)絡設備故障時,自動切換至另一個平面。
主機層:系統(tǒng)主機包括各類數(shù)據(jù)庫、中間件、后臺應用、WEB和接口服務器等,通常采用雙機主備或雙機/集群負載均衡的部署方式。
存儲網(wǎng)絡層:存儲網(wǎng)絡是未用主機與磁盤陣列之間的高速的網(wǎng)絡傳輸中繼設備,通常采用光纖線纜作為傳輸介質,1+1負載均衡的方式實現(xiàn)高可用冗余。
存儲層:對于關鍵業(yè)務的存儲磁盤陣列,通常要求存儲盤陣具有雙控制器,甚至采用雙臺存儲盤陣,結合跨盤陣的數(shù)據(jù)鏡像方式實現(xiàn)本地高可用冗余。對于異地容災需求則可采用各類遠程數(shù)據(jù)復制技術實現(xiàn)數(shù)據(jù)異地容災。
系統(tǒng)架構如圖1所示。
圖1 信息系統(tǒng)架構圖
1.2系統(tǒng)高可用的業(yè)務指標
信息系統(tǒng)的高可用能力通常可用2個指標來衡量,包括RTO(RecoveryTime Object)、RPO(RecoveryPoint Object)。RTO(恢復時間目標)是指災難發(fā)生后,從IT系統(tǒng)宕機導致業(yè)務停頓開始,到IT系統(tǒng)恢復至可以支持各部門運作、業(yè)務恢復運營之時兩點之間的時間段;RPO(恢復點目標)是指一個過去的時間點,當災難或緊急事件發(fā)生時,數(shù)據(jù)可以恢復到的時間點。
2 三種高可用技術
2.1 存儲虛擬化技術
存儲虛擬化技術是在物理存儲系統(tǒng)和服務器之間增加一個虛擬層,管理和控制所有存儲并對服務器提供存儲服務。服務器不直接與存儲硬件打交道,存儲硬件的增減、調換、分拆、合并對服務器層完全透明。它屏蔽了存儲硬件的復雜程度,允許將現(xiàn)有的功能集成使用,擺脫了物理容量的局限。
存儲虛擬化主要有兩種實現(xiàn)方式:基于軟件和基于硬件引擎。基于硬件引擎:虛擬引擎在一個專用的硬件設備上或光纖交換機上,從連接到SAN的存儲上劃分虛擬卷。典型產(chǎn)品有IBM SVC、EMCVPLEX。基于軟件:即將虛擬化軟件安裝在應用主機上,在連接到主機的不同存儲上劃分虛擬卷。典型產(chǎn)品有Symantec VERITAS CFS。
存儲虛擬化技術提供同步復制功能,來自服務器的更新被寫入本地連接的控制器集群(Cluster)的緩存,該系統(tǒng)將數(shù)據(jù)轉發(fā)給異地數(shù)據(jù)中心連接的控制器集群的緩存。只有當兩個控制器集群的緩存都擁有數(shù)據(jù)的拷貝以后本地系統(tǒng)才會向處理器返回一個I/O完成指示。同步遠程拷貝能夠在異地數(shù)據(jù)中心提供最新程度的數(shù)據(jù)當前值。
通過利用存儲虛擬化技術的同步鏡像功能,可以保證本地源卷和遠程目的卷的數(shù)據(jù)完全一致,由此保證了雙活數(shù)據(jù)中心的業(yè)務連續(xù)性。它屬于最底層硬件設備提供的“零切換”能力,相對于傳統(tǒng)容災技術可以減少用戶的維護工作量,有效避免故障時技術平臺的切換操作過程。如圖2所示。
圖2 存儲虛擬化同步鏡像機制
2.2集群數(shù)據(jù)庫Oracle RACE
集群數(shù)據(jù)庫技術是將多臺數(shù)據(jù)庫服務器聯(lián)合起來組成集群,實現(xiàn)綜合性能優(yōu)于單個大型數(shù)據(jù)庫服務器的技術。Oracle RAC又為“真實應用集群”,是其中最典型的產(chǎn)品,用于數(shù)據(jù)庫服務器的高可用。它采用緩存融合技術,使各數(shù)據(jù)庫主機將它們的數(shù)據(jù)緩存合并為一個共享的全局緩存,從而利用所有存活節(jié)點的緩存和CPU資源,當某節(jié)點發(fā)生故障時,可從節(jié)點失效中快速恢復。如圖3所示。
圖3 Oracle RAC集群
2.3集群文件系統(tǒng)
集群文件系統(tǒng)可以實現(xiàn)同一個文件系統(tǒng)通過SAN光纖網(wǎng)絡同時被多個主機訪問,在邏輯卷層面上保證了雙數(shù)據(jù)中心的應用對文件系統(tǒng)數(shù)據(jù)的并發(fā)雙活訪問。應用程序在雙數(shù)據(jù)中心節(jié)點上均可以同時啟動并對外提供服務,發(fā)生故障時無需切換。而且高可用集群可以自動進行業(yè)務的切換,降低了人工操作的難度和時間。
3 業(yè)務支撐系統(tǒng)容災保障新思路探討
通過虛擬化存儲技術,存儲可以異地部署,實現(xiàn)兩個數(shù)據(jù)中心的存儲資源同步。利用數(shù)據(jù)庫集群及集群文件系統(tǒng),實現(xiàn)源數(shù)據(jù)和災備數(shù)據(jù)可同時被讀寫。結合上述技術的優(yōu)勢,我們得到一種新的存儲高可用技術,進而形成業(yè)務支撐系統(tǒng)容災保障新思路——存儲雙活中心。其中,依據(jù)所使用的存儲虛擬化技術不同,存儲雙活中心可以有兩種設計方案實現(xiàn)。
3.1 基于存儲虛擬化硬件引擎的雙活存儲中心設計方案
在主機和IP網(wǎng)絡層,利用大二層以太網(wǎng)絡技術,將本地和異地兩個數(shù)據(jù)中心的數(shù)據(jù)庫組成4節(jié)點的RAC(4節(jié)點RAC之間的Cache Fusion需要高速穩(wěn)定的網(wǎng)絡來保證)。本地故障時,可使用異地RAC節(jié)點進行業(yè)務接管,兩個數(shù)據(jù)中心節(jié)點RAC心跳網(wǎng)絡由大二層網(wǎng)絡提供。Web服務器本地采用負載均衡器的方式,異地進行同等服務器性能配置;應用及中間件服務器本地及異地使用相同配置。
在存儲網(wǎng)絡和存儲層,利用光纖鏈路,實現(xiàn)數(shù)據(jù)同步鏡像(存儲虛擬化+集群文件系統(tǒng))技術實現(xiàn)本地和遠端的統(tǒng)一存儲池。通過虛擬化的存儲引擎,實現(xiàn)兩個站點資源的同時使用,再配合使用集群文件系統(tǒng),實現(xiàn)同一份文件系統(tǒng)數(shù)據(jù)被多個主機同時訪問,在雙數(shù)據(jù)中心節(jié)點上均可以同時啟動并對外提供服務,實現(xiàn)雙活模式。
本方案的優(yōu)點是可以實現(xiàn)不同站點的不同主機同時訪問同一個數(shù)據(jù)庫,實現(xiàn)雙活模式;單個站點發(fā)生故障或災難時,無需切換應用便可快速接管。不足之處在于雙中心有距離限制,必須在100公里以內(nèi),并且對網(wǎng)絡延遲、帶寬、網(wǎng)絡質量穩(wěn)定性要求高。圖4為基于存儲虛擬化硬件引擎實現(xiàn)的雙活方案。
圖4 基于存儲虛擬化硬件引擎實現(xiàn)雙活方案
3.2基于存儲虛擬化軟件的雙活存儲中心設計方案
在主機和網(wǎng)絡層,同樣利用大二層以太網(wǎng)絡技術,將本地和異地兩個數(shù)據(jù)中心的數(shù)據(jù)庫組成4節(jié)點的RAC,與基于存儲虛擬化硬件引擎的雙活存儲中心設計方案一致。
在光纖網(wǎng)絡和存儲層,利用存儲虛擬化軟件和光纖鏈路實現(xiàn)本地和遠端的統(tǒng)一存儲池,構建生產(chǎn)存儲和容災存儲為實時鏡像關系,實現(xiàn)存儲數(shù)據(jù)的遠程容災,再配合使用集群文件系統(tǒng),實現(xiàn)同一份文件系統(tǒng)數(shù)據(jù)被多個主機同時訪問,在雙數(shù)據(jù)中心節(jié)點上均可以同時啟動并對外提供服務,實現(xiàn)雙活模式。
該方案去除對存儲虛擬化硬件的需求,采用軟件方式實現(xiàn)存儲虛擬化和存儲數(shù)據(jù)的實時鏡像,實現(xiàn)不同站點不同主機同時訪問同一個數(shù)據(jù)庫的雙活模式;單個站點發(fā)生故障或災難時,無需切換應用便可快速接管。缺點是雙中心距離更受限制,需要更大的帶寬和較低的延遲來保證性能,并且以軟件方式實現(xiàn)存儲虛擬化會額外消耗主機處理能力。存儲虛擬化軟件實現(xiàn)雙活方案見圖5所示。
圖5 基于存儲虛擬化軟件實現(xiàn)雙活方案
3.3雙活存儲中心與傳統(tǒng)應急容災系統(tǒng)比較
對存儲雙活中心與傳統(tǒng)應急容災系統(tǒng)進行對比,見表1所示。
表1 業(yè)務效果的對比
4 結論
雙活數(shù)據(jù)中心方案可以實現(xiàn)在本地和遠端兩個數(shù)據(jù)中心在同時提供業(yè)務支撐能力,作為一種應急容災新思路,能充分利用容災主機的處理能力,減少資源浪費,同時又能解決業(yè)務系統(tǒng)在災難及日常維護過程中造成的停機問題,該思路同樣適用于其他大型、復雜的信息系統(tǒng)容災。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.lukmueng.com/
本文標題:關于利用虛擬化技術實現(xiàn)業(yè)務支撐系統(tǒng)容災保障的思路探討
本文網(wǎng)址:http://www.lukmueng.com/html/support/1112159437.html