企業容災架構選型必知概念、跨中心數據復制技術

發布時間:2022-07-19作者:小編閱讀:0

一、必須知道的概念

1. 什么是企業的容災?

1.1 什么是企業的業務連續性管理(Busin꧑ess Continuity Management)?

企業的業務連續性是指企業有應對風險、自動調整和快速反應的能力,以保障企業業務的連續運轉。為企業的重要應用和流程提供業務連續性應該包括連續操作(Continuous Operations)、高可用性(High Availability)、災難恢復(Disaster Recovery)三個方面,這幾個方面不是孤立存在的,而是相互聯系存在的。連續操作強調的指在沒有物理故障發生的情況下,保障業務連♏續的常規運維操作能力;高可用性強調的是基礎架構在本地故障的場合下的恢復能力;災難恢復強調的是在災難場合下,企業的業務恢復能力。從業務連續性上來講,企業的容災也就是我們所說的災難恢復范疇,應該是業務連續性的子集。

1.2 什么是企業的容災架構(Disaster Tolerance)?

廣義的容災,我們可以認為就是業務連續性計劃當中的災難恢復,就是指能夠容忍災難的能力。要容忍的災難類型就包括地震、洪水、火災等災害、軟硬件故障、網絡或病毒攻擊、人為蓄意破壞等。容災能力建設的主要目的,就是在災難發生的時候,能夠保證生產♎業務系統的不間斷運行。

狹義的容災,我們可以認為是指在相隔較遠的區域(同🧜城或者異地),建立兩套或多套功能相同的💛IT系統,互相之間可以進行健康狀態監視和功能切換,當一處系統因意外停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。

1.3 什么是企業的備份和恢復(Backup and Recovery)?

備份和恢復是指備份數據以防數據丟失,且🅠設置安全系統以便恢復數據的流程。數據備份要求復制和存檔計算機數據以保證數據損壞或刪除后數據仍可訪問。數據備份恢復是業務恢復✤的一種形式,因此它屬于業務連續性計劃當中的連續操作和災難恢復范圍。備份包括系統備份和數據備份,系統備份是指將系統運行環境作為一個整體進行備份,當發生故障時將系統運行環境整體恢復。數據備份是指將應用系統當中保存的數據作為單獨的形式進行備份,當數據發生丟失或者損壞的時候進行恢復。

1.4 什么是企業IT基礎架構的高可用(High Availability)?

高可用性(High Availabilit💦y)通常🍨來描述一個系統經過專門的設計,從而減少停工時間,而保持其服務的高度可用性。企業的高可用架構通常指的是為了在面對數據中心本地軟硬件故障場景下,保證業務的連續性而規劃部署的非對稱(主備、主從)以及對稱架構(主主、集群),可以是網絡架構、主機架構、數據庫架構以及存儲架構等類IT基礎架構,例如交換機的堆疊技術、負載均衡設備的集群架構、主機的HA架構、數據庫的Oracle RAC集群等。

1.5 什么是企業的IT基礎架構的容錯(Fault-tolerant)?

在計算機通信領域來講,容錯就是指當系統在運行時有錯誤被激活的情況下仍能保🧸證不間斷提供服務的方法和技術。從廣義來講,我們💙所述的容災、備份恢復、高可用等都是容錯的一種手段。

但是通常來講,我們對IT基礎架構當中的容錯性有著約定俗成的專指含義,實際上它是指我們在IT設備配置或者軟件配置過程當中,為了杜絕網絡線路、設備零件、軟件模塊等方面的運行錯誤導致的應用系統中斷而采取的冗余性設計。例如網ꦍ卡的邏輯綁定、存儲鏈路的聚合、LVM邏輯卷設計等等。

1.6 如何理解業務連續性、備份恢復以及容災?

1、從范疇上來講,我們用以下的圖來詮釋這幾個概念的差異。

備份恢復、高可用架構設計、容錯設計、容災都是為了保障業務連續性的一種手段、技術和工具。在廣義的容災設計當中必♛꧑然也會包括基礎架構的高可用設計、設備軟件的容錯設計以及必要的備份恢復。但是備份恢復、高可用和容錯是可以獨立存在的,不依賴容災架構。

2、從設計功能上來講,備份恢復不僅僅可以解決由物理故障引起的數據損壞和丟失,而且更重要的是它可以解決由人為的邏輯錯誤導致的數據損壞和丟失,比如誤刪數據。備份恢復是一種事后的補救措施,也就是說它只能發🦂生在問題發生之后。容錯、高可用、容災中核心的架構設計是為了解決實時問題,是一種事中解決問題的思路,但是這兩者都無法解𒀰決人為導致的邏輯錯誤故障導致的業務中斷,只能解決物理故障導致的業務中斷問題。

3、從所屬性質來講,業務連續性是著眼業務層面的一套解決思路或者方法論指導下的制度、流程、方案、技術、工具、資源等一系列元素組成的。而容災、高可用、備份恢復、容錯僅僅是為了保障業ꦑ務連續而對基礎架構進行設計實現的技術工具或者手段。

2. 企業容災架構的核心目標是什么?

企業容災架構的核心目標是什么?也就是說我們為什么要花這么大力氣去搞容災建設?就一句話,RTO&RPO是搞容災建設的最核心目標ౠ,一切容災建設目的都需要回到RTO和RPO的評估上來。

① RTO:企業可容許服務中斷的時間長度,簡言之業務可以恢復的最快時間。

② RPO:企業可容許數據丟失的數量級,簡言之數據可以恢復到最新的時刻點。

如圖所示,RTO關注的是數據丟失的多少,而對什么時候恢復業務中斷沒有要求;RPO關注的是什么時候恢復業務,但是歷史數據丟失多少并沒有要求。只有這兩個結合起來才是對現實生活當中的業務連續性的🌠約束。要實現什么樣的RTO&RPO目標,一定會有相應的方案來支撐,也必然有對此方案需要付出的IT成本投入。我們評估容災的目標要求,一定是從RTO&♐RPO的選定范圍出發,然后權衡企業可以付諸的投入,最終確定合理的容災建設方案。

3. 企業容災架構的行業標準都有哪些?

3.1企業容災的國家級標準

《信息安全技術信息系統災難恢復規范》國家標準(GB/T20988-2007)是我國災難備份與恢復行業的第一個國家標準。該標準由國務院信息化工作辦公室領導編制的,并于2007年11月1日開始正式實施。該標準規定了信息🅷系統災難恢復應遵循的基本要求,適用于信息系統災難꧂恢復的規劃、審批、實施和管理,并參照國際標準SHARE78的7個層級定義,確定了符合中國國情的6個災備能力等級要求。下面,概括性地介紹各個層級的內容:

1級:數據定時備份、異地存放。

2級:數據定時備份、異地設備冷備。

3級:數據定時備份、異地部分業務熱備接管。

4級:數據定時備份、異地業務熱備接管。

5級:數據實時備份、異地業務熱備接管。

6級:零數據丟失、遠程自動接管支持。

3.2企業容災的行業監管標準

對于評價容災的RTO&RPO這兩個指標,不同的行業有🐟不同的行業標準,例如人民銀行在2008年的《銀行業信息系統災難恢🎶復管理規范》當中規定:銀行類信息系統恢復要求:

① 一類信息系統:RTO<6小時,rpo<15分鐘。🧔< p="">

② 二類信息系統:RTO<24小時,rpo&ꦜlt;120分鐘。< p="">

③ 三類信息系統:RTO<7天。< p="">

對于銀行行業꧅來講,所有容災建設必須遵循這個最低要求。在此基礎之上,不同的企業對自身有不同的要求。比如工商銀行、招商銀行之類發展比較優秀的銀行企業對自己提出了更高的要求(RTO~0,RPO~0),有些小的地方銀行則因為成本問題,是為了達到銀監局及人民銀行的最低要求而搞容災建設。但是無論是出于什么樣的目的搞容災建設,最終必然要回到對RTO和RPO的評估上來,沒有這兩個核心目標的選擇,則一切容災建設方案都無根可尋。

3.3企業容災的自我衡量標準

另外一種標準就是企業本身的業務要求,例如生產企業,RTO是可以直接計算企🍸業損失的指標,如果停產1個小時將會給企業帶來多少可計算的損失以及不可計算的損失。我們可以根據這個損失來衡♎量可以為容災建設付出的成本范圍。

4. 企業容災架構都包含哪些技術框架?

企⭕業的容災架構根據容災的地域距離可以劃分為本地容災和異地容災,而且整個容災架構不是單獨的一類技術或者一類工具,而是系統的整體技術框架,包含了很多的元素💃和技術體系,如果分解闡述,可以從縱向和橫向進行分解描述。

首先,從縱向來講,整個容災架構包括網絡層、負載分發層、應用中間件層、應用層以及數據涉及的數據庫和存儲層,其中數據層最為重要,直接關系到RPO指標,應用層往上則主要關系到RTO指標。接著,我們從橫向上來講,會包括集群技術、數據復♌制技術以及應用切換技術,數據復制技術又是整個容災的關鍵,因為它直接關系到RPO指標,應用切換技術則直接關系到RTO指標,集群技術一般是指在近距離(例如同城🐼)場合下的數據復制和應用切換技術的融合體。最后,我們從整體基礎架構來講,為了支撐以上技術體系的實現,我們需要有一系列的軟硬件基礎架構來支撐其最終的實現,比如我們的交換機、服務器、存儲、備份介質、網絡線路以及為了實現應用的切換和數據復制技術體系所需要的SDN、LB、GLB、VM、HA、DB Cluster、Storage Gateway、Storage DP等軟件模塊。

接下來,我們來看實現企業容災架構橫向支撐的一些關鍵技術:

① 網絡的跨地域L2技術(主要為虛擬機的漂移、集群IP地址漂移等):同城距離可以采用波分設備和思科的OTV技術來實現跨中心的L2技術,但是這種技術可跨越的距離僅限百公里范圍內級別。另外一類就是采用Overlay隧🍸道技術,在原有網絡基👍礎架構之上通過邏輯隧道的模式實現L2的傳輸,這種技術不受距離限制,但是性能不是最佳。

② 跨數據中心負載分發技術(主要為客戶端訪問流量的切換):通常需要域名解析꧙DNS與本地負載均衡LB結合來實現全局的負載分發。DNS需要能夠實現動態解析,也就是根據備⭕選地址池的健康狀況來確定最終的業務地址。本地不在均衡LB實現本地內的負載導流。如圖所示:

③ 跨數據中心VM集群內漂移技術(主要為應用的跨地域高可用服♏務):通常可以通過虛擬機的跨地域集群技術實現,只要具備跨數據中心L2網絡和存儲卷共享的條件,基本上都可以實現。關于跨區域的L2網絡技術,上述章節已討論過。存儲卷共享可以通過NAS或者分布式存儲來實現。

④ 跨數據中心數據復制技術(主要為數據跨區域冗余服務):數據復制技術是關鍵,它是保障容災目標RTO&RPO𓄧的關鍵技術,根據容災級別的不同,可分為同步復制和異步復制,所使用的實現手段也因💝此而不同。關于它的具體實現方式,可以考慮從三個層面落地:系統層的雙寫、數據庫層的數據復制、存儲層的復制。具體實現方式及其優劣在后續文章詳細介紹。

5. 數據復制技術在企業容災架構當中的意義

如果上升到商業業務的高度,那么一切容災技術都是為了業務的連續性服務的。

具體來說,數據復制技術即完成數據從一個數據中心到另外的數據中心的冗余性保護。一旦發生災難導致一個數據中心的數據丟失或者損壞,可以通過另外一個數據中心的數據來支撐應用系統運行。沒有應用系統的不中斷運行就沒有業務的連續性可言,🎶沒有數據的存在就沒有應用系統的不中斷運行可言,沒有數據復制技術的支撐就沒有容災的必要性可言。數據在應用系統當中的地位直接決定了數據復制技術在容災框架當中的絕對必要性地位。

① RPO:簡言之,RPO就是衡量災難時刻依靠容災手段可以丟失的最少數據。數據復制的及時性直接決ꦍ定RPO的量級標準,如果數據復制是同步模式,那么RPO必然是零。如果數據是異步模式,那么RPO就直接與數據﷽復制的異步效率指標息息相關。

② RTO:簡言之,RTO就是衡量災難時刻依靠容災手段可以恢復ꦦ業務的最短時間🅘。這個不僅僅取決于數據復制技術,還要依賴于縱向的網絡、負載分發、服務器、應用、數據庫、存儲等各個層面的恢復技術。但是,數據復制技術一定是所有恢復技術的基石,沒有這個基石,及時所有層面都恢復了,沒有數據的業務訪問也依然無效。

因此,數據復制技術是容災體系架構當中最關鍵的技術元素。

二、跨中心數據復制技術

1. 什么是企業容災的數據復制技術?

企業容災♔架構中,所謂的數據復制技術主要是指能夠將結構化數據進行復制,從而保證數據具備雙副本或者多副本分散在不同數據中心的技術。這里面需要強🔯調兩點:

① 結構化數據:以結構化數據為主的數據復制技術。

② 分散在不同數據中心:數據副本必須分布在不同的數據中心。

就具體的實現技術而言,就目前業界發展來看,可以實現數據復制的技術多種多樣,有基于數據庫層面的數據復制技術,例如Oracle公司的Active Data Gurad、IBM公司的 Db2 HADR等;有基于系統層面的數據復制技術,例如賽門鐵克的vxvm、傳統的邏輯卷管理(LVM)、Oracle公司的自動存儲管理(ASM)冗余技術、IBM公司的GPFS等;有基于存儲虛擬化實現的數據復制技術,例如EMC公司Vplex Stretch Cluster、IBM公司SVC Split Cluster、NetAPP公司Metro Cluster等;也有基于存儲底層實現的數據復制技術,例如IBM公司的DS8000 PPRC技術、EMC公司的SRDF技術、HP公司的CA技術等等。每一種技術都有其實現的🐷前提條件,也有各自的技術特點和實現的不同效果。

2. 企業容災中的數據復制技術的分類

2.1 同步復制和異步復制

從RPO維度來劃分,大的方面可以分為同步復制和異步復制。

① 同步復制:要求每一個寫入操作在執行下一個操作處理之前,在源端和目標端都能完成。特點是數據丟失少,會影響生產系統性💃能,除非目標系統物理上離生產系統比較近。

② 異步復制:在處理下一個操作前, 只需要完成源端數據寫入即可, 不等待數據復制到目標系統🎉中。特點是復制的數據與源數據👍有時間差,但這種復制對生產系統性能影響較小。

那么這里有一個問題“如何界定一個寫入操作完成?”,一般來講,存儲端的🅠寫入以存儲設備的緩存寫入為標準,數據庫的寫入以數據庫的事務日志落盤為標準𒉰。

企業容災架構選型必知概念、跨中心數據復制技術

如果用圖的方式來區別同步𒀰和異步之前的區別就在于:同步需要等待黑色和紅色的ACK返回才會執行下一個IO,而異步只需要等待黑色的ACK返回即可執行🌞下一個IO。從結果上來看,等待紅色的ACK返回顯然需要花費更多時間,因為A和B分別位于不同的數據中心;但是等待會帶來RPO=0的回報。

2.2 根據實現復制的手段來劃分

企業容災架構選型必知概念、跨中心數據復制技術

根據上圖,數據復制最🍷終完成的結果是在兩個磁盤介質上完成同一個IO數據,但是將來自客戶端的單個IO請ꩵ求鏡像為兩個IO的源頭可以有三種不同的選擇:操作系統層面、數據庫層面以及存儲層面。

1). 操作系統層面的復制技術:以LVM、ꦏVXVM等邏輯卷鏡像為基礎,IO寫入的時候可以在組成同一個邏輯卷的物理鏡像上同時寫入數據,底層😼數據寫入是需要通過SAN協議完成的。

2). 數據庫層面的復制技術:一種是類似操作系統邏輯卷的模式,比如ORACLE的ASM,它也是一種邏輯卷管理模式,同樣也可以通過多個物理鏡像來組成一個邏輯卷,從而通過鏡像復制的方式完成數據副本的同時寫入。本質上它與操作系統層面的邏輯卷鏡像技術沒有區別,只是它離數據庫更近,數據庫更懂它。另外一種是通過數據庫事務日志復制的方式將數據修改行為在另外一個備庫上重新演繹一遍🌜,最終可以達到使數據結果一致的目的。

3). 存儲層面的復制技術:一種是通過存儲網關將兩個物理存儲卷組成一個邏輯存儲卷,通過鏡像復制的方式完成數據在存儲落盤時的雙寫。本質上它與操作系統層面的邏輯卷鏡像技術也沒有區別,只是它選擇在存儲層面實🐼現。另外一種是通過存儲介質之間以塊拷貝的方式來實現數據副本的冗余。

究其原理,其實無論從哪個層面來實現,這些技術從原理上可以劃分為三種類型:

1、IO雙寫(操作系統邏輯卷鏡像、ASM、存儲網關鏡像.etc)

2、事務回放(以Oracle ADG為代表.etc)

3、數據單元拷貝(以存儲CA、DP技術為代表的存儲復制技術)

3. 系統層如何實現數據復制?

3.1 通過操作系統邏輯卷鏡像實現數據復制

企業容災架構選型必知概念、跨中心數據復制技術

對于操作系統層面的邏輯卷管理器LVM模式來講,是將底層來自不同數據中心的的兩個物理存儲卷作為物理鏡像( PV) ꦉ組合成一個可用的邏輯存儲卷( LV) 提供給上層應用來存放數據,本地物理卷和遠程物理卷分別是由存儲經過本地SAN環境以及跨數據中心SAN環境提供給服務器操作系統層。

建立邏輯卷的時候♔就已經定義好LV和PV的映射關系,并且邏輯頁(LP ) 和物理頁(PP ) 的映射關系也已經完全定義好了。這種復制只能采用同步復制機制,復制對象為邏輯卷層的變化Block,其過程為:捕獲邏輯頁( LP) 當中的變化塊,同步寫兩個物理頁( PP) ,等于在一個主機上將同一數據寫入兩個不同的磁盤,本地🍨寫完得到ACK確認,并且遠端寫完也得到ACK確認,才能算是一個完整的寫入。假設遠端存儲卷寫入超時就會被標為故障或者是離線狀態,當遠端存儲寫入恢復之后,對于LVM來講需要重新進行手動同步實現鏡像副本完全一致。

3.2 通過數據庫邏輯卷鏡像實現的數據復制

企業容災架構選型必知概念、跨中心數據復制技術

對于ASM模式來講,其實原理與LVM基本相同,創建DiskGroup的🌟時候,將冗余策略選擇為Normal,也就是所有業務數據保證兩份鏡像。這樣的話,我們可以將相等數量的磁盤分別歸入不同的故障組( Failure Group) 。ASM對Oracle數據文件( Data File) 進行修改的時候,以AU為單元進行實時雙向寫入,本地寫完得到ACK確認,并且遠端寫完也得到ACK確認,才能算是一個完整的寫入。

相比LVM的優勢在于兩點:ASM會有一個短時間內的寫事務日志記錄,它會幫助恢復離線鏡像恢復數據,𒁏但是如果超過這個時間,同樣需要一個全𓆏新的同步來保證數據的一致性。另外一點,AU并非建立數據文件的時候就已經映射好了,ASM是在數據寫入時才會分配具體的AU,完全可以做到通過指針轉移的方式避免壞塊兒導致的數據寫入失敗問題。

3.3 通過分布式文件系統文件鏡像實現的數據復制

企業容災架構選型必知概念、跨中心數據復制技術

對于GPFS模式來講,它是通過將底層來自不同站點的兩個物理存儲卷歸屬到不同的Failure Group當中,然后由這些物理存儲卷經過文件系統格式化形成分布式文🌳件系統,提供給上層應用以文件的形式寫入數據。文件本身會被GPFS文件系統打散形成若干文件碎片,這些碎片在落盤時分別落入不同Failure Group當中的物理磁盤,從而保證底層數據的雙副本。這種模式與前兩種模式的最大區別在于它的數據落盤是根據NSD磁盤定義的服務實例順序來決定的,正常情況下我們需要定義本站點的服務節點為磁盤的主服務節點,這樣的話兩個鏡像寫入的時候是靠GPFS位于不同中心的兩個服務實🍸例節點分別寫入,兩個服務實例之間也需要私有協議的交互,相當于數據的雙寫多了一個環節。

4. 數據庫層如何實現數據復制?

4.1 通過數據庫日志回放模式實現數據復制

對于事務日志的復制技術,可以分為絕對同步模式、近似同步模式和異步模式三種。

企業容災架構選型必知概念、跨中心數據復制技術

對于Oracle DB來講,客戶端的數據更新請求首先要由日志寫入進程( LGWR) 從重做緩存刷到重做日志文件當中,然后由數據寫進程再周期性地寫入數據文件當中。重做日志當中以SCN為數據庫獨有的時間戳序列來記錄所有數據庫更新的先后順序,從而保障數據𓆉庫恢復能夠按照正確的順序執行保障數據一致性和完整性。也就是說在數據庫的認知當中,只要事務日志寫入重做日志文件,這個IO就算完成。

企業容災架構選型必知概念、跨中心數據復制技術

如圖,對于配置了Data Guard絕對同步模式的數據庫,在以上所述過程中,寫入進程( LGWR) 在本地日志文件并不能結束,日志傳輸進程( LNS) 會將緩存里面的重做日志通過TCP /IP 網絡傳輸給災備站點的備庫實例的日志接受進程(RFS ) ,備庫實例的日志接收進程( RFS) 根據接受到的重做日志在備庫上重新執行數據庫的更新操作,然后將ACK回傳給日志傳輸進程( LNS) ,日志傳輸進程( LNS) 再通知寫入進程( LGWR) ,才算是一個完整的IO完成。這樣做可以保ꦑ證主庫和備庫的事務性更新行為實時一致,最終保證數據的一致。當然也有一個前提條件,那就是在Data Guard開始同步復制之前,必須保證備庫的數據保持與主庫的某一固定時間點的完整副本,這需要靠傳統數據備份技術來實現備庫的初始數據復制。因為事務復制的本質是行為復制,那么行為作用的初始數據副本必須保持一致,才能保證最終兩副本的一致性。

如圖,對于配置了Data Guar🌄d異步模式的數據庫,日志傳輸進程( LNS) 會將緩存里面的重做日志以及被LGWR歸檔的重做日志文件通過TCP /IP 網絡異步傳輸給災備站點的備庫實例的日志接受進程(RFS ) ,備庫實例的日志接收進程( RFS) 根據接受到的重做日志在備庫上重新執行數據庫的更新操作,但是并不會實時給日志傳輸進程( LNS) 進行ACK反饋,PrimaryDB只要完成本庫的事務更新就認為IO結束。但是備庫日志接受進程(RFS ) 會定期將進度信息反饋給主庫進程。

當主備庫傳輸管理剝離之后,主庫會主動通過以下兩種方式探💞測并嘗試重新和備庫建立聯系,第一是歸檔日志進程會周期性ping備庫,成功情況下,它會根據獲得的備庫控制文件的記錄的最后歸檔點和自己的歸檔日志決定向備庫推送哪些歸檔日志。第二是日志發送進程會在重做日志準備發生歸檔的時刻點主動去ping備庫日志接受進程并把剩余的重🦹做條目發送給備庫接受進程。

近似同步模式是指在傳輸正常情況下保持與絕對同步模式一樣的模式,在網絡傳輸超時的情況下,就會剝🎶離備庫重做日志的過程,只要保證主庫重做𝕴日志落盤就可以了。

5. 存儲層如何實現數據復制?

5.1 通過存儲網關邏輯卷鏡像實現數據復制

所謂存儲網關雙寫復制技術,就是在物理存儲層之上增加一層網關技術,用以形成存儲資源透明抽象層,即存儲虛擬化是服務器與存儲間的一個抽象層用以實現存儲底層的虛擬化以及高可用鏡像,它是物理存儲的邏輯表示方法。其主要目的就是要把物理存儲介質抽象為邏輯存儲空間,將分散的物理存儲管理整合為集中存儲管理并且由存儲網關來控制鏡像寫入的策略和模式。IBM、EMC、NETAPP 、 HUꦆAWEI、英方等公司都有相應容災技術方案及相應產品 。基于寫入原理及策略的不同, 各自方案又各有一些區別。但是拋開細節究原理,歸類總結之后有兩種模式 。

企業容災架構選型必知概念、跨中心數據復制技術

模式 1,如 圖中所示,是以 EMC Vplex為代表的分布式存儲卷技術。在存儲網關VPLEX上重新定義虛擬存儲卷,該虛擬卷由分布在兩個數據中心的物理存儲卷以1:1方式映射組成,并✨且以共享模式提供給VPLEX的兩個引擎,引擎之間類似Oracle RAC的原理來共享全局緩存、心跳信息以及分布式鎖的信息。兩個引擎同時可以寫IO,對于Block級別的并發寫操作,是通過分布式鎖及全局緩存機制來完成。所以這種雙寫是可以做到IO級別。

企業容災架構選型必知概念、跨中心數據復制技術

模式 2,如圖中所示,是以 IBM SVC為代表的虛擬🌌存儲卷技術。在存儲網關SVC上重新定義虛擬存儲卷,該虛擬卷由分布在兩個數據中心的物理存儲卷以1:1方式映射組成,并且歸屬同🥃一個IO Group,并且以共享模式提供給SVC的兩個節點,雖然兩個節點都可以寫操作,但是對于某一個IO Group來講,只能通過一側節點進行物理層面的雙寫操作,這樣就避免了兩個節點的在Block級別的并發控制。所以這種雙寫只能做到應用級別,做不到IO級別。

當然還有一些類似的架構,在某些細節上更先進,比如NetApp的容災方案MCC架構,它在此基礎之上可以將負責存儲寫操作的實例節點做到VM級別,VM負責以卷為粒度的雙寫,同時VM可以在存儲網關的物理引擎或節點之間進行漂移和重組,這樣的話以應用為粒度的寫操作的容災切換更加平滑ꦿ。

5.2 通過存儲介質塊復制實現數據復制

企業容災架構選型必知概念、跨中心數據復制技術

對于存儲存儲底層的塊兒復制技術來講, 它的數據復制是完全脫離了上層的應用層、系統層、數據庫層。主要是ꦰ依靠存儲層兩🍸個物理存儲設備 來完成源到目標 設備 的 Block 復制。

如圖所示,從組成上來看,只有兩個同型物理存儲設備,數據復制跟上層沒有任何關系,只需要存儲層從一邊的物理卷捕獲 Block變化,復制到另ജ外一邊的物理存儲卷,整個復制行為通過源端的日志文件來記錄進度以及保障故障恢復。根據整個復制過程是否需要等待復制完成的ACK返回可以分為同步復制和異步復制。復制過程依賴的傳輸環境可以是遠距離的以太網也可以是近距離的SAN網絡。

但是這種數據復制技術和上層的聯系幾乎是割裂的,基本很難與上層的容災切換配合。

以上就是企業容災架構選型必知概念、跨中心數據復制技術的介紹,億聯云為國內外用戶供給包括全球主機托管、主機租用、云專線接入等方面的專業服務,資源覆蓋全球。歡迎咨詢。

<!--7天。<-->


<!--24小時,rpo<120分鐘。<-->


<!--6小時,rpo<15分鐘。<-->


免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場ꦜ,請聯系站長郵箱:[email protected]進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

標題:企業容災架構選型必知概念、跨中心數據復制技術

TAG標簽:數據中心

地址://beijingyml.cn/article/20210719162436.html

上一篇:oa協同辦公組網方案,各分公司訪問SAP系統
下一篇:X86 服務器常見故障解決
返回頂部