如何管理相隔兩地的數(shù)據(jù)中心?
作者:網(wǎng)絡轉(zhuǎn)載 發(fā)布時間:[ 2012/1/6 10:35:57 ] 推薦標簽:
業(yè)務和管理需求使得數(shù)據(jù)中心管理和災難恢復的缺陷更加明顯。二十年前,用貨車運輸磁帶進行存儲能滿足需求了。十年前,兩個數(shù)據(jù)中心的距離只要能進行I/O,能滿足需求。現(xiàn)在,隨著電子商務成為首要的負載,恢復計劃還得考慮數(shù)據(jù)中心的地理距離,這一點限制了恢復時間。
地理距離與數(shù)據(jù)中心管理
概念上,這是關(guān)于兩個不同位置的數(shù)據(jù)中心,如圖1所示。在數(shù)目也許會擴展到更多站點。
圖1:地理性分離數(shù)據(jù)中心的示意圖
圖中兩個數(shù)據(jù)中心是分離的,這對于進行同步磁盤輸入輸出來說,實在太遠了,這導致了很多需求。首先每個數(shù)據(jù)中心必須得有自己的直接存取存儲設備(Direct Access Storage Device,簡稱DASD)場所來進行管理。第二是同步硬件復制會因為網(wǎng)絡延遲而無法工作。后,距離也意味著,每個數(shù)據(jù)中心的邏輯分區(qū)(logical partition,簡稱LPAR)不能處于同一個Sysplex(Systems Complex,系統(tǒng)聯(lián)合體)里面。
網(wǎng)絡在數(shù)據(jù)中心管理中占了重要位置,是兩個數(shù)據(jù)中心之間的切換開關(guān)。有了合適的內(nèi)部通訊系統(tǒng),以后的要求都可以基于不同標準,按路線分給每個數(shù)據(jù)中心。其實,有了現(xiàn)在基于瀏覽器的應用,用戶可以實現(xiàn)不同數(shù)據(jù)中心的不間斷切換。
因為硬件復制不可用,數(shù)據(jù)必須在邏輯數(shù)據(jù)庫或者訪問方式(access method)的級別上被獲取。有幾個產(chǎn)品可以做這件事。部分產(chǎn)品得通過讀數(shù)據(jù)庫或Virtual Storage Access Method(簡稱VSAM)記錄來升級。變更投到其他數(shù)據(jù)中心,通過通信線路使用多種的傳輸協(xié)議。在接收端,由另一個軟件發(fā)給數(shù)據(jù)庫或訪問方式命令來完成遠程升級。
為相隔兩地的數(shù)據(jù)中心配置
分離的數(shù)據(jù)中心有好幾種方式來配置,能想到的有以下幾種:
Hot-warm
企業(yè)中一個數(shù)據(jù)中心被指派成為所有網(wǎng)絡流量的目標。在第一個數(shù)據(jù)中心的升級會被復制到第二個數(shù)據(jù)中心站點,第二個會接收并把這些改變用在本地的DASD場所。一旦第一個數(shù)據(jù)中心故障,若第二個站點在線,混亂會降至低。
升級-查詢
在升級-查詢的方案中,一個數(shù)據(jù)中心地區(qū)全體升級,而其他只允許查詢。升級的站點為只讀的系統(tǒng)聯(lián)合體及時帶來改變。如果升級數(shù)據(jù)中心失敗,負責查詢的系統(tǒng)聯(lián)合體得負全責。
網(wǎng)絡在進行這種安裝時,起決定性作用,它必須能問信息內(nèi)容,來區(qū)分詢問和升級事務。工作站可能也會使用網(wǎng)絡來平衡負載,使每個數(shù)據(jù)中心能夠帶上屬于自己的只讀流量。
升級-升級
這是個實實在在的事。每個數(shù)據(jù)中心支持所有數(shù)據(jù)的所有升級。兩種方式的復制流經(jīng)通信連接,保持數(shù)據(jù)庫的同步。一旦發(fā)生故障,沒有出問題的數(shù)據(jù)中心承擔所有即將到來的流量。
注意當兩個數(shù)據(jù)中心都升級時,數(shù)據(jù)在邏輯上可能會分離。比如說對用戶的初級數(shù)據(jù)庫在密西西比河西邊的“A數(shù)據(jù)中心”,第二個只讀的數(shù)據(jù)在“B數(shù)據(jù)中心”。用戶在哪一邊都可能是反向的。終,這意味著網(wǎng)絡必須足夠智能,知道客戶的初級數(shù)據(jù)在哪。
其他的問題
相信各位深思熟慮的讀者已經(jīng)想到不少這些問題。但是還有更多令人不安的不穩(wěn)定因素。
批處理??在升級-升級的模式下,生產(chǎn)量會問題多多。企業(yè)得決定哪一方進行批處理,如果批處理兩方都得進行更頭疼了。還得考慮對帶寬的需求,用以從I/O相關(guān)批處理事務中擠出空間升級,通過復制鏈接。
復制的延遲??現(xiàn)代通信連接又快有可靠,但還會有問題。算是快完美的通信線也不能和DASD I/O一樣同步和快速。因此,系統(tǒng)基礎架構(gòu)和一部分應用必須準備好應對延遲和“過時”的數(shù)據(jù)。
沖突問題??數(shù)據(jù)庫管理系統(tǒng)(Database Management Systems,簡稱DBMS)在不同的系統(tǒng)聯(lián)合體中,不能從太寬的距離鎖定數(shù)據(jù)庫記錄。這導致在不同數(shù)據(jù)中心內(nèi),相同的數(shù)據(jù)庫記錄可能會同時升級;A設施和應用需要準備好應對混亂。
控制改變??基礎設施、應用和數(shù)據(jù)庫設計的改變一定得認真管理,避免破壞在不同數(shù)據(jù)中心復制的一致性。
漂移??沒有異步復制技術(shù)在邏輯I/O層面是完美的,企業(yè)會發(fā)現(xiàn)分叉數(shù)據(jù)存儲變慢。整理這些不同需要周期性的調(diào)和進程。
死亡??對于數(shù)據(jù)中心來說,什么算死?數(shù)據(jù)中心通過復制流量和heartbeat來保持聯(lián)系。但是復制流量的減慢可能預示著一個數(shù)據(jù)中心工作做的少了。同樣地,一些遺落的heartbeat也暗示著網(wǎng)絡故障或減慢,而不是數(shù)據(jù)中心故障。
探查和遵照這些察覺到的故障來行事,要求精心策劃的政策、高度自動化和仔細的管理。好消息是數(shù)據(jù)中心的地理分離逐漸變得平常,解決這些問題的政策也變得更加便于學習。
相關(guān)推薦
相關(guān)產(chǎn)品

最新發(fā)布
性能測試之測試環(huán)境搭建的方法
2020/7/21 15:39:32軟件測試是從什么時候開始被企業(yè)所重視的呢?
2020/7/17 9:09:11Android自動化測試框架有哪些?有什么用途?
2020/7/17 9:03:50什么樣的項目適合做自動化?自動化測試人員應具備怎樣的能力?
2020/7/17 8:57:06幾大市面主流性能測試工具測評
2020/7/17 8:52:11RPA機器人能夠快速響應企業(yè)需求,是怎么做到的?
2020/7/17 8:48:05Bug可以真正消滅嗎?為什么?
2020/7/17 8:43:03軟件測試基本概念是怎么來的?軟件測試生命周期的形成歷經(jīng)了什么?
2020/7/16 9:11:10