在當(dāng)今高度依賴信息系統(tǒng)的時(shí)代,業(yè)務(wù)連續(xù)性已成為企業(yè)運(yùn)營的生命線。對(duì)于山東移動(dòng)這樣的省級(jí)通信服務(wù)提供商而言,其龐大的用戶基數(shù)、海量的數(shù)據(jù)處理需求以及7x24小時(shí)不間斷的服務(wù)承諾,使得構(gòu)建一套高可靠、高可用的數(shù)據(jù)中心容災(zāi)體系成為必然選擇。其中,雙活容災(zāi)架構(gòu)以其近乎零恢復(fù)時(shí)間目標(biāo)(RTO)和零數(shù)據(jù)丟失目標(biāo)(RPO)的卓越特性,成為保障核心業(yè)務(wù)連續(xù)性的關(guān)鍵方案。而在雙活容災(zāi)體系的底層,磁盤陣列的性能、可靠性與數(shù)據(jù)同步能力,直接決定了整個(gè)架構(gòu)的穩(wěn)固性與效能。
雙活容災(zāi)的本質(zhì),是在兩個(gè)或多個(gè)數(shù)據(jù)中心同時(shí)運(yùn)行相同的應(yīng)用,并能實(shí)現(xiàn)負(fù)載均衡與故障無縫切換。這不僅要求網(wǎng)絡(luò)層、計(jì)算層、應(yīng)用層的高度協(xié)同,更對(duì)數(shù)據(jù)存儲(chǔ)層提出了前所未有的要求:
基于以上挑戰(zhàn),山東移動(dòng)在雙活容災(zāi)一期實(shí)踐中,對(duì)磁盤陣列的選型與配置進(jìn)行了深入研究和嚴(yán)格驗(yàn)證:
1. 選用高端智能存儲(chǔ)陣列
采用具備Active-Active雙活原生功能的高端存儲(chǔ)系統(tǒng)。這類陣列通常采用多控制器全活架構(gòu),內(nèi)部通過高速互聯(lián)背板實(shí)現(xiàn)控制器間的緩存鏡像與數(shù)據(jù)同步,對(duì)外提供統(tǒng)一的邏輯卷和訪問路徑,為跨數(shù)據(jù)中心的雙活打下硬件基礎(chǔ)。
2. 部署同步復(fù)制技術(shù)
在兩數(shù)據(jù)中心的高端陣列之間,通過存儲(chǔ)層專用的同步復(fù)制軟件(如基于存儲(chǔ)微碼的遠(yuǎn)程鏡像功能)建立數(shù)據(jù)鏈路。當(dāng)主機(jī)向本地陣列寫入數(shù)據(jù)時(shí),陣列在確認(rèn)數(shù)據(jù)寫入本地緩存并標(biāo)記為“已鏡像”后,會(huì)同時(shí)通過裸光纖或低延遲專用網(wǎng)絡(luò)將數(shù)據(jù)塊同步傳輸至對(duì)端陣列的緩存。僅在收到對(duì)端確認(rèn)后,才向主機(jī)返回寫操作完成信號(hào)。此機(jī)制確保了RPO=0。
3. 構(gòu)建低延遲互聯(lián)網(wǎng)絡(luò)
為存儲(chǔ)同步鏈路規(guī)劃獨(dú)立的、與業(yè)務(wù)網(wǎng)絡(luò)隔離的網(wǎng)絡(luò)平面。采用DWDM(密集波分復(fù)用)技術(shù),在山東移動(dòng)兩個(gè)數(shù)據(jù)中心之間鋪設(shè)直達(dá)的裸光纖,將存儲(chǔ)復(fù)制鏈路延遲嚴(yán)格控制在1毫秒以內(nèi)(距離依賴),這是實(shí)現(xiàn)高性能雙活的生命線。
4. 實(shí)施智能負(fù)載均衡與路徑管理
在主機(jī)層(服務(wù)器),安裝多路徑軟件(如PowerPath、Native MPIO等),并將其配置為支持“主動(dòng)-主動(dòng)”模式的ALUA(Asymmetric Logical Unit Access)或類似策略。這使得主機(jī)可以同時(shí)通過兩個(gè)站點(diǎn)的存儲(chǔ)網(wǎng)絡(luò)路徑訪問同一份數(shù)據(jù)卷,并根據(jù)路徑狀態(tài)和延遲智能分發(fā)I/O,實(shí)現(xiàn)負(fù)載均衡和故障瞬間切換。
部署完成后,山東移動(dòng)建立了常態(tài)化的容災(zāi)演練機(jī)制:
構(gòu)建了涵蓋存儲(chǔ)性能、復(fù)制狀態(tài)、鏈路健康度的全方位監(jiān)控體系,對(duì)緩存利用率、復(fù)制延遲、鏈路誤碼率等關(guān)鍵指標(biāo)進(jìn)行實(shí)時(shí)告警與容量預(yù)測(cè)。
磁盤陣列作為雙活容災(zāi)的數(shù)據(jù)基石,其穩(wěn)定、高效、智能的數(shù)據(jù)同步與管理能力,是山東移動(dòng)實(shí)現(xiàn)業(yè)務(wù)永續(xù)目標(biāo)的第一道堅(jiān)實(shí)屏障。通過選用成熟的高端雙活存儲(chǔ)方案,并輔以精心的網(wǎng)絡(luò)設(shè)計(jì)與嚴(yán)格的運(yùn)維管理,山東移動(dòng)成功構(gòu)建了存儲(chǔ)層的“同城雙活”能力,為核心業(yè)務(wù)系統(tǒng)提供了持續(xù)可用的數(shù)據(jù)服務(wù)。雙活容災(zāi)是一個(gè)系統(tǒng)工程,存儲(chǔ)層的就緒僅是第一步。在(下)篇中,我們將繼續(xù)探討在數(shù)據(jù)庫、虛擬化及云平臺(tái)層面,山東移動(dòng)如何與存儲(chǔ)層協(xié)同,最終實(shí)現(xiàn)應(yīng)用級(jí)的無縫雙活與切換,完成從“數(shù)據(jù)雙活”到“業(yè)務(wù)雙活”的跨越。